C# 网络编程之通过豆瓣API获取书籍信息

本文涉及的产品
智能开放搜索 OpenSearch行业算法版,1GB 20LCU 1个月
OpenSearch LLM智能问答版免费试用套餐,存储1GB首月+计算资源100CU
简介:

这篇文章主要是讲述如何通过豆瓣API获取书籍的信息,起初看到这个内容我最初的想法是在"C# 网络编程之网页简单下载实现"中通过HttpWebResponse类下载源码,再通过正则表达式分析获取结点标签得到信息.但后来发现可以通过豆瓣API提供的编程接口实现.
该文章仅是基础性C#网络编程文章,尝试测试了下豆瓣API,并没什么高深的内容.但希望对大家有所帮助,仅供学习.
(警告:文章仅供参考,提供一种想法,否则访问多次-10次被403 forbidden莫怪.建议认证使用豆瓣API)

一.豆瓣API介绍

在开发之前你需要申请创建一个应用,从而获取一个新的API Key(唯一标识你的Connect站点和API使用者).
正如豆瓣API快速入门(
http://www.douban.com/service/apidoc/guide)中例子:这个示例中展示了使用API获得ID为1220562的书的信息, 请求的url如下(注意将{yourapikey}替换为你的API Key).
http://api.douban.com/book/subject/1220562?apikey={yourkeyapi}
返回的XML文档如下所示:

<?xml version="1.0" encoding="UTF-8"?>
<entry xmlns="http://www.w3.org/2005/Atom" xmlns:db="http://www.douban.com/xmlns/" 
xmlns:gd="http://schemas.google.com/g/2005" 
xmlns:openSearch="http://a9.com/-/spec/opensearchrss/1.0/" 
xmlns:opensearch="http://a9.com/-/spec/opensearchrss/1.0/">
	<id>http://api.douban.com/book/subject/1220562</id>
	<title>满月之夜白鲸现</title>
	<category scheme="http://www.douban.com/2007#kind" term="http://www.douban.com/2007#book"/>
	<author>
		<name>[日] 片山恭一</name>
	</author>
	<link href="http://api.douban.com/book/subject/1220562" rel="self"/>
	<link href="http://book.douban.com/subject/1220562/" rel="alternate"/>
	<link href="http://img3.douban.com/spic/s1747553.jpg" rel="image"/>
	<link href="http://m.douban.com/book/subject/1220562/" rel="mobile"/>
	<summary>那一年,是听莫扎特、钓鲈鱼和家庭破裂的一年。说到家庭破裂,母亲怪自己当初没有找到好男人,父亲则认为当时是被狐狸精迷住了眼,失常的是母亲,但出问题的是父亲……。</summary>
	<db:attribute name="isbn10">7543632608</db:attribute>
	<db:attribute name="isbn13">9787543632608</db:attribute>
	<db:attribute name="title">满月之夜白鲸现</db:attribute>
	<db:attribute name="pages">180</db:attribute>
	<db:attribute name="translator">豫人</db:attribute>
	<db:attribute name="author">[日] 片山恭一</db:attribute>
	<db:attribute name="price">15.00元</db:attribute>
	<db:attribute name="publisher">青岛出版社</db:attribute>
	<db:attribute name="binding">平装</db:attribute>
	<db:attribute name="pubdate">2005-1</db:attribute>
	<db:tag count="125" name="片山恭一"/>
	<db:tag count="59" name="日本"/>
	<db:tag count="53" name="日本文学"/>
	<db:tag count="36" name="小说"/>
	<db:tag count="31" name="满月之夜白鲸现"/>
	<db:tag count="14" name="爱情"/>
	<db:tag count="8" name="純愛"/>
	<db:tag count="8" name="外国文学"/>
	<gd:rating average="7.0" max="10" min="0" numRaters="322"/>
</entry>

此时,我需要做的就是通过输入的URL获取返回的XML中的数据,通过HttpWebRequest和HttpWebResponse获取HTTP请求和应答,并解析XML中的信息(较难).后来我才发现如果想试验下API,豆瓣是允许在不申请API Key情况下进行API调用(每分钟请求不超过10次).也就是说我在程序中输入网址如下即可返回XML.
http://api.douban.com/book/subject/1220562

二.C#获取豆瓣书籍信息

1.添加命名空间

using System.Net;                      //HTTP
using System.IO;                       //文件 流操作
using System.Text.RegularExpressions;  //正则表达式
using System.Xml;                      //Xml文档

2.添加按钮点击事件

//点击按钮"获取信息"
private void button1_Click(object sender, EventArgs e)
{
    richTextBox1.Clear();
    //获取输入的URL
    string url = textBox1.Text.ToString();
    //HttpWebRequest对象实例:该类用于获取和操作HTTP请求 创建WebRequest对象
    HttpWebRequest request = (HttpWebRequest)WebRequest.Create(url);
    //HttpWebResponse对象实例:该类用于获取和操作HTTP应答 
    HttpWebResponse response = (HttpWebResponse)request.GetResponse();
    //构造字节流
    StreamReader reader = new StreamReader(response.GetResponseStream());
    //流从头读至尾
    string xmlUrl = reader.ReadToEnd();
    reader.Close();
    response.Close();
    //调用自定义函数获取XML信息
    GetInfoXML(xmlUrl);
}

3.自定义函数获取书籍信息

//获取豆瓣XML内容并显示
private void GetInfoXML(string xmlUrl)
{
    try
    {
        //实例Xml文档
        XmlDocument xmlDoc = new XmlDocument();
        //从指定字符串加载xml文档 
        xmlDoc.LoadXml(xmlUrl);                       
        //实例解析、加入并移除集合的命名空间及范围管理
        XmlNamespaceManager xmlNM = new XmlNamespaceManager(xmlDoc.NameTable);
        //将给定命名空间添加到集合 
        xmlNM.AddNamespace("db", "http://www.w3.org/2005/Atom");
        //获取文档根元素
        XmlElement root = xmlDoc.DocumentElement;
        //选择匹配Xpath(内容)表达式的结点列表 
        //函数原型:SelectNodes(string xpath,XmlNamespaceManger nsmgr)
        XmlNodeList nodes = root.SelectNodes("/db:entry", xmlNM);

        //获取子节点信息
        foreach (XmlNode nodeData in nodes)
        {
            foreach (XmlNode childnode in nodeData.ChildNodes)
            {
                string str = childnode.Name;
                switch (str)
                {
                    case "title":
                        string name = "标题名称:" + childnode.InnerText + "\r\n\r\n";
                        richTextBox1.AppendText(name);
                        break;                    
                    case "author":
                        string author = "作者:" + childnode.InnerText + "\r\n\r\n";
                        richTextBox1.AppendText(author);
                        break;
                    case "db:attribute":
                        { 
                            //获取<db:attribute name="XXX">的属性
                            switch (childnode.Attributes[0].Value)
                            {
                                case "pages":
                                    string pages="总页数:"+childnode.InnerText+"\r\n\r\n";
                                    richTextBox1.AppendText(pages);
                                    break;
                                case "price":
                                    string price="价格:"+childnode.InnerText+"\r\n\r\n";
                                    richTextBox1.AppendText(price);
                                    break;
                                case "publisher":
                                    string publisher="出版社:"+childnode.InnerText+"\r\n\r\n";
                                    richTextBox1.AppendText(publisher);
                                    break;
                                case "pubdate":
                                    string pubdate="出版日期:"+childnode.InnerText+"\r\n\r\n";
                                    richTextBox1.AppendText(pubdate);
                                    break;
                            }
                            break;
                        }
                    case "summary":                             
                        //显示内容 WordWrap设置为true自动换行(无需调用Split函数或求字符长度)
                        string summary="内容:"+childnode.InnerText+"\r\n\r\n";                                
                        richTextBox1.AppendText(summary);                             
                        break;
                    case "link":
                        //结点属性是Attributes[0]却失败,不能获取
                        if (childnode.Attributes[1].Value == "image")
                        {
                            //获取image路径 <link rel="image" href="http://xxx.jpg"/> 
                            string imagePath = childnode.Attributes[0].Value;
                            //下载图片
                            string imageName = "local.jpg";
                            System.Net.WebClient client = new System.Net.WebClient();
                            //下载指定URL资源到本地文件夹
                            //函数原型 DownloadFile(string address,string fileName)
                            client.DownloadFile(imagePath,imageName);
                            //从本地文件中加载图片
                            this.pictureBox1.Image = Image.FromFile(imageName);
                            //图像原图大小
                            this.pictureBox1.SizeMode = PictureBoxSizeMode.Zoom;
                            //下载第二张图片时总是出现"WebClient请求期间发生异常"
                        }
                        break;
                } //switch
            } //foreach
        } //foreach
    }
    catch (Exception msg) //异常处理
    {
        MessageBox.Show(msg.Message);
    }
} //GetInfoXML

4.运行结果如下


源网址中的书籍信息介绍如下图所示:

三.遇到的问题及总结

由上图可以发现我输入的网址没有包含API key也能获取,但我在测试时总是使用的.然后同时我也遇到了一些问题:
1.豆瓣API获取书籍信息接口,需要传subjectID或isbnID(国际标准书号),但我想实现的是只知道书名,就能获取书籍的信息,而不是仅仅传入一串URL,这些分析都让程序内容实现,这是接下来需要做的.
2.在使用WebClient和DownloadFile(string address,string fileName)下载图片时,当获取第二张图片总会提示错误"WebClient请求期间发生异常",不知道为啥,但不想使用stream或并发获取图片,仅想知道这是为啥?
3.这仅仅是一篇基础性的介绍使用豆瓣API的文章,目前豆瓣针对已经授权用户(开发API采用OAuth协议进行鉴权)可以实现很多功能,后面如果有时间可以写些“查看用户信息、用户友邻信息、增删改查用户收藏、查看评论”的文章.

最后希望该文章对大家有所帮助,如果文章中有错误或不足之处,还请海涵.同时文章也参考了一些资料,感谢这些作者.
(By:Eastmount 2014-5-2 下午3点 原创:http://blog.csdn.net/eastmount)
参考资料:
1.豆瓣API快速入门
http://www.douban.com/service/apidoc/guide
2.c#使用豆瓣API-sun8134
这里非常感谢该文章,在解析XML中我使用SelectSingleNodes方法失败后,参考了他的方法,也推荐大家去阅读
http://www.cnblogs.com/sun8134/archive/2010/12/15/1906879.html
3.豆瓣客户端-zh19900207 该文章仅有界面,但也是我想实现的功能描述
http://blog.csdn.net/zh19900207/article/details/8586000
4.XmlNode.SelectNodes 方法
http://msdn.microsoft.com/zh-cn/library/4bektfx9.aspx

相关实践学习
基于OpenSearch搭建高质量商品搜索服务
本场景主要介绍开放搜索(OpenSearch)打造独有的电商行业垂直解决方案,模板内置电商查询分析、排序表达式及行业算法能力,沉浸式体验更高性能和效果的智能搜索服务,助力企业在线业务智能增长。
目录
相关文章
|
2月前
|
安全 物联网 物联网安全
量子通信网络:安全信息交换的新平台
【10月更文挑战第6天】量子通信网络作为一种全新的安全信息交换平台,正逐步展现出其独特的优势和巨大的潜力。通过深入研究和不断探索,我们有理由相信,量子通信网络将成为未来信息安全领域的重要支柱,为构建更加安全、高效、可靠的信息社会贡献力量。让我们共同期待量子通信网络在未来的广泛应用和美好前景!
|
1月前
|
机器学习/深度学习 计算机视觉 网络架构
【YOLO11改进 - C3k2融合】C3k2DWRSeg二次创新C3k2_DWR:扩张式残差分割网络,提高特征提取效率和多尺度信息获取能力,助力小目标检测
【YOLO11改进 - C3k2融合】C3k2DWRSeg二次创新C3k2_DWR:扩张式残差分割网络,提高特征提取效率和多尺度信息获取能力,助力小目DWRSeg是一种高效的实时语义分割网络,通过将多尺度特征提取分为区域残差化和语义残差化两步,提高了特征提取效率。它引入了Dilation-wise Residual (DWR) 和 Simple Inverted Residual (SIR) 模块,优化了不同网络阶段的感受野。在Cityscapes和CamVid数据集上的实验表明,DWRSeg在准确性和推理速度之间取得了最佳平衡,达到了72.7%的mIoU,每秒319.5帧。代码和模型已公开。
【YOLO11改进 - C3k2融合】C3k2DWRSeg二次创新C3k2_DWR:扩张式残差分割网络,提高特征提取效率和多尺度信息获取能力,助力小目标检测
|
1月前
|
监控 安全 测试技术
网络信息系统的整个生命周期
网络信息系统规划、设计、集成与实现、运行维护及废弃各阶段介绍。从企业需求出发,经过可行性研究和技术评估,详细设计系统架构,完成设备安装调试和系统集成测试,确保稳定运行,最终安全退役。
39 1
网络信息系统的整个生命周期
|
24天前
|
安全 Linux 网络安全
nmap 是一款强大的开源网络扫描工具,能检测目标的开放端口、服务类型和操作系统等信息
nmap 是一款强大的开源网络扫描工具,能检测目标的开放端口、服务类型和操作系统等信息。本文分三部分介绍 nmap:基本原理、使用方法及技巧、实际应用及案例分析。通过学习 nmap,您可以更好地了解网络拓扑和安全状况,提升网络安全管理和渗透测试能力。
94 5
|
27天前
|
SQL 安全 算法
网络安全的隐形盾牌:漏洞防御与信息加密的艺术
【10月更文挑战第36天】在数字世界的海洋中,网络安全犹如一艘船的保护罩,守护着我们的隐私和数据安全。本文将揭开网络安全的神秘面纱,从常见的网络漏洞到先进的加密技术,再到培养必要的安全意识,我们将一步步构建起防御的堡垒。文章不仅分享技术细节,还强调了在个人和组织层面采取积极措施的重要性。
|
1月前
|
存储 关系型数据库 MySQL
查询服务器CPU、内存、磁盘、网络IO、队列、数据库占用空间等等信息
查询服务器CPU、内存、磁盘、网络IO、队列、数据库占用空间等等信息
294 2
|
1月前
|
安全 网络协议 算法
网络空间安全之一个WH的超前沿全栈技术深入学习之路(8-1):主动信息收集之ping、Nmap 就怕你学成黑客啦!
网络空间安全之一个WH的超前沿全栈技术深入学习之路(8-1):主动信息收集之ping、Nmap 就怕你学成黑客啦!
|
24天前
|
网络协议 Unix Linux
精选2款C#/.NET开源且功能强大的网络通信框架
精选2款C#/.NET开源且功能强大的网络通信框架
|
1月前
|
机器学习/深度学习 计算机视觉 网络架构
【YOLO11改进 - C3k2融合】C3k2融合DWRSeg二次创新C3k2_DWRSeg:扩张式残差分割网络,提高特征提取效率和多尺度信息获取能力,助力小目标检测
【YOLO11改进 - C3k2融合】C3k2融合DWRSDWRSeg是一种高效的实时语义分割网络,通过将多尺度特征提取方法分解为区域残差化和语义残差化两步,提高了多尺度信息获取的效率。网络设计了Dilation-wise Residual (DWR) 和 Simple Inverted Residual (SIR) 模块,分别用于高阶段和低阶段,以充分利用不同感受野的特征图。实验结果表明,DWRSeg在Cityscapes和CamVid数据集上表现出色,以每秒319.5帧的速度在NVIDIA GeForce GTX 1080 Ti上达到72.7%的mIoU,超越了现有方法。代码和模型已公开。
|
2月前
|
SQL 安全 算法
网络安全与信息安全:构建数字世界的防线在数字化浪潮席卷全球的今天,网络安全与信息安全已成为维系社会秩序、保障个人隐私与企业机密的重要基石。本文旨在深入探讨网络安全漏洞的本质、加密技术的前沿进展以及提升安全意识的有效策略,为读者揭示数字时代下信息保护的核心要义。
本文聚焦网络安全与信息安全领域,详细剖析了网络安全漏洞的形成机理、常见类型及其潜在危害,强调了及时检测与修复的重要性。同时,文章系统介绍了对称加密、非对称加密及哈希算法等主流加密技术的原理、应用场景及优缺点,展现了加密技术在保障数据安全中的核心地位。此外,针对社会普遍存在的安全意识薄弱问题,提出了一系列切实可行的提升措施,如定期安全培训、强化密码管理、警惕钓鱼攻击等,旨在引导公众树立全面的网络安全观,共同构筑数字世界的安全防线。