谷歌播客Google PodCasts解析脚本

本文涉及的产品
实时数仓Hologres,5000CU*H 100GB 3个月
智能开放搜索 OpenSearch行业算法版,1GB 20LCU 1个月
实时计算 Flink 版,5000CU*H 3个月
简介: 111


解析某个频道,全部的结果



 
import json
import requests
 
 
 
feed_url = 'https://podcasts.google.com/feed/aHR0cHM6Ly93d3cueGltYWxheWEuY29tL2FsYnVtLzQwNDc3NDU0LnhtbA?sa=X&ved=0CNwBEI7OAigIahcKEwjgyKrX5Or-AhUAAAAAHQAAAAAQAQ'
 
 
def get_item_from_feed(url):
    out_item_list = []
    
    html = requests.get(url).text
    #with open('1.html', 'w') as f2:
    #    f2.write(html)
    for line in html.split('\n'):
        if 'AF_initDataCallback(' in line:
            blocks = line.split("AF_initDataCallback(")
            #print(blocks)
            assert ');' in blocks[1]
            block = blocks[1].split(");")[0]
            #print(block)
 
            #with open('1.js', 'w') as f3:
            #    f3.write(block)
 
            assert 'data:' in block
            assert ', sideChannel:' in block
            list_raw = block.split('data:')[1]
            list_raw = list_raw.split(', sideChannel:')[0]
            with open('1.json' , 'w' ) as f4:
                f4.write(list_raw)
            d_list = json.loads(list_raw)
            #print(d_list[1])
            list2 = d_list[1]
            for item in list2:
                for sub_item in item:
                    print(sub_item)
                    channel = sub_item[1]
                    id1 = sub_item[11]
                    id2 = sub_item[12]
                    title = sub_item[8]
                    link = sub_item[13]
                    desc = sub_item[14]
                    image = sub_item[15]
                    out_item = {
                        "channel": channel,
                        "id1": id1,
                        "id2": id2,
                        "title": title,
                        "link": link,
                        "desc": desc,
                        "image": image,
                    }
                    print(out_item)
                    out_item_list.append(out_item)
    with open("out_item.list", 'w') as f5:
        for item in out_item_list:
            raw1 = json.dumps(item, ensure_ascii=False)
            f5.write(raw1+'\n')
    return out_item_list
 
            
            
 
 
def get_one_audio(url, file_name):
    res = requests.get(URL)
    print(res)
    c = res.content
    with open('file_name' ,'wb') as f1:
        f1.write(c)
 
def main():
    get_item_from_feed(feed_url)
 
 
if __name__ == "__main__":
    main()
 
 
相关文章
|
18天前
|
设计模式 存储 人工智能
深度解析Unity游戏开发:从零构建可扩展与可维护的游戏架构,让你的游戏项目在模块化设计、脚本对象运用及状态模式处理中焕发新生,实现高效迭代与团队协作的完美平衡之路
【9月更文挑战第1天】游戏开发中的架构设计是项目成功的关键。良好的架构能提升开发效率并确保项目的长期可维护性和可扩展性。在使用Unity引擎时,合理的架构尤为重要。本文探讨了如何在Unity中实现可扩展且易维护的游戏架构,包括模块化设计、使用脚本对象管理数据、应用设计模式(如状态模式)及采用MVC/MVVM架构模式。通过这些方法,可以显著提高开发效率和游戏质量。例如,模块化设计将游戏拆分为独立模块。
43 3
|
28天前
|
XML Web App开发 数据挖掘
Postman接口测试工具全解析:功能、脚本编写及优缺点探讨
文章详细分析了Postman接口测试工具的功能、脚本编写、使用场景以及优缺点,强调了其在接口自动化测试中的强大能力,同时指出了其在性能分析方面的不足,并建议根据项目需求和个人偏好选择合适的接口测试工具。
37 1
|
28天前
|
Java Shell Linux
【Linux入门技巧】新员工必看:用Shell脚本轻松解析应用服务日志
关于如何使用Shell脚本来解析Linux系统中的应用服务日志,提供了脚本实现的详细步骤和技巧,以及一些Shell编程的技能扩展。
22 0
【Linux入门技巧】新员工必看:用Shell脚本轻松解析应用服务日志
|
2月前
|
人工智能 自然语言处理 API
谷歌Gemini入口_(Google gemini Pro官方网站入口)
Gemini是 Google 开发的多模态 AI 语言模型。可以理解和生成人类语言,并协助各种与语言相关的任务。
|
2月前
|
存储 数据库 Android开发
🔥Android Jetpack全解析!拥抱Google官方库,让你的开发之旅更加顺畅无阻!🚀
【7月更文挑战第28天】在Android开发中追求高效稳定的路径?Android Jetpack作为Google官方库集合,是你的理想选择。它包含多个独立又协同工作的库,覆盖UI到安全性等多个领域,旨在减少样板代码,提高开发效率与应用质量。Jetpack核心组件如LiveData、ViewModel、Room等简化了数据绑定、状态保存及数据库操作。引入Jetpack只需在`build.gradle`中添加依赖。例如,使用Room进行数据库操作变得异常简单,从定义实体到实现CRUD操作,一切尽在掌握之中。拥抱Jetpack,提升开发效率,构建高质量应用!
50 4
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
Google gemini官网入口是什么_谷歌 AI gemini国内怎么使用
随着人工智能(AI)技术的迅猛发展,各大科技公司不断推出更为先进的AI模型,推动技术的边界。Google开发的Gemini便是其中的佼佼者。作为一款大型语言模型(LLM),Gemini旨在处理多种自然语言处理(NLP)任务,如文本生成、翻译、摘要和对话生成。Gemini结合了最新的研究成果和技术,显著提高了自然语言处理的准确性和效率。
|
3月前
|
Java 数据库连接
提升编程效率的利器: 解析Google Guava库之IO工具类(九)
提升编程效率的利器: 解析Google Guava库之IO工具类(九)
|
3月前
|
缓存 Java Maven
深入解析Google Guava库与Spring Retry重试框架
深入解析Google Guava库与Spring Retry重试框架
|
3月前
|
监控 安全 算法
提升编程效率的利器: 解析Google Guava库之RateLimiter优雅限流(十)
提升编程效率的利器: 解析Google Guava库之RateLimiter优雅限流(十)
|
3月前
|
缓存 监控 安全
深入解析Elasticsearch中脚本原理
深入解析Elasticsearch中脚本原理

推荐镜像

更多