【原创】抖音个人视频列表采集

简介: 【原创】抖音个人视频列表采集
本文所有教程及源码、软件仅为技术研究。不涉及计算机信息系统功能的删除、修改、增加、干扰,更不会影响计算机信息系统的正常运行。不得将代码用于非法用途,如侵立删!

抖音个人视频列表采集

环境

  • win10、mac
  • Python3.9

2023.3.3更新

现在需要效验ck中的tk参数,特此更新一下

获取所需参数

   defget_cookie(self):

       count=10

       whilecount:

           try:

               session=requests.session()

               h=session.get(url, verify=False, allow_redirects=False, timeout=20).headers

               x_vc_bdturing_parameters=h.get('x-vc-bdturing-parameters')

               ifnotx_vc_bdturing_parameters:

                   count-=1

                   logger.info(f'提取:x_vc_bdturing_parameters 失败,重试!')

                   time.sleep(random.randint(3, 5))

                   continue

               verify_data=json.loads(base64.b64decode(h.get('x-vc-bdturing-parameters')).decode("utf-8"))

               fp=verify_data.get("fp")

               detail=verify_data.get("detail")

               logger.info(f"成功提取:{fp}, 开始验证")

               try:  # 有几率报错,报错重试

                   msg=Verify().verify(fp, detail)

                   logger.info(msg)

               exceptExceptionase:

                   logger.info(f"{e}")

                   continue

               ifmsg.get('code') !=200:

                   logger.info(f"{msg.get('message')},重试")

                   continue

               logger.info(f"ck s_v_web_id:{fp}, {msg.get('message')}")

               s_v_web_id=f's_v_web_id={verify_data.get("fp")};'

               self.cookie=s_v_web_id

               return

           exceptExceptionase:

               logger.info(f'提取:x_vc_bdturing_parameters 出错:{e}')

               time.sleep(random.randint(3, 5))

               continue

根据作者id获取所有视频

   defget_aweme_list(self, sec_user_id):

       """

       根据作者ID获取所有视频ID

       """

       headers= {

           "accept": "application/json, text/plain, */*",

           "accept-language": "zh-CN,zh;q=0.9",

           "bd-ticket-guard-client-csr": "LS0tLS1CRUdJTiBDRVJUSUZJQ0FURSBSRVFVRVNULS0tLS0NCk1JSUJEekNCdFFJQkFEQW5NUXN3Q1FZRFZRUUdFd0pEVGpFWU1CWUdBMVVFQXd3UFltUmZkR2xqYTJWMFgyZDENCllYSmtNRmt3RXdZSEtvWkl6ajBDQVFZSUtvWkl6ajBEQVFjRFFnQUVWdHJwOUhyOTdwRCttcGVxcTZIZzBUanUNCnJQRVpGSVQzajBTUGFQNGVGaXRzeHU5U3U2ZWJFWHVDNDVlYkMxbExFVlBGVXNPZFF6TWlsTjFmWThDdlZxQXMNCk1Db0dDU3FHU0liM0RRRUpEakVkTUJzd0dRWURWUjBSQkJJd0VJSU9kM2QzTG1SdmRYbHBiaTVqYjIwd0NnWUkNCktvWkl6ajBFQXdJRFNRQXdSZ0loQU5WOWlTOUVzVGszem5KOFprTDVNKzNZTk11NTRRNnF6Qm5kUy9Yd1Y3b1INCkFpRUFxbERLTkcrcUMyMjBBQ1B2Z1IrVlI2VWh3RXhUOEZTS0N2LzU2clBrMmNzPQ0KLS0tLS1FTkQgQ0VSVElGSUNBVEUgUkVRVUVTVC0tLS0tDQo=",

           "bd-ticket-guard-version": "2",

           "cache-control": "no-cache",

           "pragma": "no-cache",

           "referer": "https://www.douyin.com/",

           "sec-ch-ua": "^\\^Chromium^^;v=^\\^110^^, ^\\^Not",

           "sec-ch-ua-mobile": "?0",

           "sec-ch-ua-platform": "^\\^Windows^^",

           "sec-fetch-dest": "empty",

           "sec-fetch-mode": "cors",

           "sec-fetch-site": "same-origin",

           "cookie": self.cookie,

           "user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/110.0.0.0 Safari/537.36"

       }

       params= {

           "aid": "6383",

           "channel": "channel_pc_web",

           "sec_user_id": sec_user_id,

           "max_cursor": int(time.time()) *1000,

           "locate_item_id": "7064150578586193188",

           "locate_query": "false",

           "show_live_replay_strategy": "1",

           "count": "100",

           "publish_video_strategy_type": "2",

           "pc_client_type": "1",

           "version_code": "170400",

           "version_name": "17.4.0",

           "cookie_enabled": "true",

           "screen_width": "1680",

           "screen_height": "1050",

           "browser_language": "zh-CN",

           "browser_platform": "Win32",

           "browser_name": "Chrome",

           "browser_version": "108.0.0.0",

           "browser_online": "true",

           "engine_name": "Blink",

           "engine_version": "108.0.0.0",

           "os_name": "Windows",

           "os_version": "10",

           "cpu_core_num": "4",

           "device_memory": "8",

           "platform": "PC",

           "downlink": "10",

           "effective_type": "4g",

           "round_trip_time": "100",

           "msToken": ""

       }

       x_b=self._get_xb(params=params)

       print(x_b)

       params['X-Bogus'] =x_b

       response=self._parse_url(url, headers=headers, params=params)

       # print(response.text)

       # logger.info(response.text)

       aweme_list=response.json().get('aweme_list')

       ifnotaweme_list:

           logger.info(f'获取失败:{sec_user_id}')

           returnNone

       aweme_ids= [i.get('aweme_id') foriinaweme_list]

       descs= [i.get('desc') foriinaweme_list]

       logger.info(f'成功获取{sec_user_id}视频ID列表:{len(aweme_ids)}条')

       foriinzip(aweme_ids, descs):

           print(i)

s_v_web_id 滑块验证,和x-b算法,之前文章有分析过,再次就不过多赘述了,有兴趣的可以去看下:https://cenjy.blog.csdn.net/article/details/126193773

效果

资源下载

https://download.csdn.net/download/qq_38154948/87527573


本文仅供学习交流使用,如侵立删!


相关文章
|
Python Windows
一键生成朋友圈公众号转发截图,自定义朋友圈点赞评论
Python实现朋友圈转发截图制作,生成自定义点赞评论
|
存储 Android开发 Python
使用 MitmProxy 自动抓取微信公众号阅读数、点赞和再看数据(一)
某天接到一个需要抓取某某微信公众的所有历史文章的阅读数、点赞和再看数据的需求。 为了解放双手,就用 Python 代码撸一个,选择 MitmProxy 代理作为抓包工具,因为它可以使用 Python 代码监听抓取到的 url,用于自动获取 cookie 等场景。
1712 0
使用 MitmProxy 自动抓取微信公众号阅读数、点赞和再看数据(一)
|
6月前
|
Web App开发 机器人
公众号爆文仿写RPA机器人,采集,仿写,发布一条龙服务
公众号爆文仿写RPA机器人,采集,仿写,发布一条龙服务
397 1
|
5月前
|
前端开发
html+css 实现产品小米产品展示效果(记得收藏)
html+css 实现产品小米产品展示效果(记得收藏)
|
7月前
|
开发工具
抖音sdk接口,同步抖音粉丝列表
抖音sdk接口,同步抖音粉丝列表
|
SQL XML 前端开发
怎么做社区网站的首页帖子展示?
要进行首页帖子展示,就必须学会分页,而在创建分页之前,我们得先认识到,为什么要进行分页?一个大型网站的数据库将容纳大量的数据,而我们进行展示某部分数据时,为了保证浏览速度,不可能一次性地将所有数据进行传输,更何况,不是全部传输过去的数据第一时间就能有效利用,所以,只要每次将需要的数据传输过去就好,即使是后续需要的数据,那也是后面时间点需要完成的工作,为了做到这一点,必须对一个数据整体进行划分,合理地传输并展示给用户,其中,划分出来的每一部分可被称为一页数据,完成划分工作的就是分页操作。而分页操作在 spingboot 及 mybatis 的环境下,可被分为以下几种分页情况:
154 0
|
存储 编解码 前端开发
谷粒学院(十一)课程最终发布 | 课程列表 | 阿里云视频点播服务 | 小节实现视频上传(二)
谷粒学院(十一)课程最终发布 | 课程列表 | 阿里云视频点播服务 | 小节实现视频上传
谷粒学院(十一)课程最终发布 | 课程列表 | 阿里云视频点播服务 | 小节实现视频上传(二)
|
前端开发 JavaScript API
谷粒学院(十一)课程最终发布 | 课程列表 | 阿里云视频点播服务 | 小节实现视频上传(三)
谷粒学院(十一)课程最终发布 | 课程列表 | 阿里云视频点播服务 | 小节实现视频上传(三)
谷粒学院(十一)课程最终发布 | 课程列表 | 阿里云视频点播服务 | 小节实现视频上传(三)
|
XML SQL 前端开发
谷粒学院(十一)课程最终发布 | 课程列表 | 阿里云视频点播服务 | 小节实现视频上传(一)
谷粒学院(十一)课程最终发布 | 课程列表 | 阿里云视频点播服务 | 小节实现视频上传
谷粒学院(十一)课程最终发布 | 课程列表 | 阿里云视频点播服务 | 小节实现视频上传(一)
|
数据采集 Python
Python爬虫系列13-采集快手短视频官网数据
读书不是唯一出路,但学习一定是。 有些人忙碌的活着,有些人努力的拼搏,有些人随意挥霍青春,人生百态,各有不同。
Python爬虫系列13-采集快手短视频官网数据