本文作者:leopard7777777
前言:从1月27号开始,淘宝、天猫决定,不再把每样商品的具体成交记录告诉你,只保留总销量数据、以及它在全网的销售排名。
结果:在”累计评价“最后的历史交易div被删除。从http流量中也未获取到相应的痕迹
首先要找到原先的div是如何展示、获取数据的。那么通过搜索引擎的快照,获取详情页的旧版信息。百度爬虫默认是被taobao屏蔽的,所以通过google进行尝试
找到有快照的地址,可以根据日期范围过滤并排序
找到过去的一个历史成交记录的接口(PS:此处少了一个环节,因为文章是最近写的,快照更新过了)
https://detailskip.taobao.com/service/getData/1/p1/item/detail/showBuyerList.htm?step=false&page_size=15&ends=1453428291000&starts=1452823491000&item_id=38452658757&sold_total_num=16&seller_num_id=152925940&dk=0&title=%25E5%2585%258D%25E8%25B4%25B9%25E7%259B%25B4%25E9%2582%25AE%25E8%258B%25B1%25E5%259B%25BDUK%25E5%2593%2581%25E7%2589%258CNature%2527s%2BBest%2B%25E5%258F%25B6%25E9%25BB%2584%25E7%25B4%25A0%2B120%25E7%25B2%2592%25E8%25A3%2585&sbn=8a6325756cb404196e50938cfe6ca91c&isTKA=false&msc=1&modules=showBuyerList
但现在已经不能使用了
站在开发者的角度,大项目的接口地址均不同部门或不同小组分工完成,因此其中接口的名称定义必须是一目了然。根据旧接口的route,尝试用inurl: showBuyerList site:taobao.com去搜索试试
只得到两条结果
Json的url中 Taobao Query ,但并没有什么卵用,sec二级域是用于安全认证的
仔细往下阅读英文
得到了更多的链接
大概10页的链接,均没有什么卵用
仍然是站在开发者的角度,一个念头浮现,showBuyerList是用驼峰法去定义名称,那么我用下划线_ 分割的名称定义去搜索试试
同理展示更多结果
有布局格式,这个很关键,虽然没有数据,也没有关系
思路四 :
同上,bid_page=9&item_id=22315247651&seller_id=1028185725&page_size=10,每一个key都是一目了然
seller_id:卖家ID
item_id:商品ID(非SKU)
bid_page:第几页
page_size:一页几个
组合一个可用的地址:
https://licai.taobao.com/json/show_buyer_list.html?bid_page=1&item_id=525850484428&seller_id=2455547464&page_size=10
根据成交记录结合流量来源和行业转化,可以分析出竞争对手的爆款操作模式,做过啥活动,刷过多少单,都可以推导。虽说这些数据也推算不出什么权重组合或拟合预测,但我相信控制变量法,是个商家都会用。不过我敢说公开后第二天这个接口就不能用了,留个图做个纪念,反正我也不做淘宝。
最后附上一个scrapy,拿去耍,请求频率无限制
https://github.com/leopard7777777/taobao_deal_history
这个接口大概是我几个月前弄到,文章是最近写的,google快照大概30-90天更新一次taobao.com下的站点,所以你们现在去看快照,更新日期都是在四五月份,所有的页面历史成交接口都不显示,所以永远也无法重现过程,但旧接口和lical的接口依旧被收录,中间断了一个环节。
当时,研究淘宝搜索入口很久了,做了许多淘宝旗下数据平台的爬虫,所以拿下这个接口大概就花了30分钟。后来,我去做了跨境电商ERP和amazon爬虫,发现淘宝的反爬虫做的是国际一流的。然后投了个简历到阿里,被丑拒,工作年限不足直接刷,怒而爆接口,然后我听说最近生意参谋查的很严,但跟我也没有什么关系。
*本文作者:leopard7777777,本文属FreeBuf原创奖励计划,未经许可禁止转载