备案控制台

开发者社区问答正文

用iTextSharp读取PDF文档中文本内容：报错

用iTextSharp读取PDF文档中文本内容，执行这条Reader reader = new PdfReader(@"C:\WS.pdf");语句时，提示PDF header signature not found，

using System;
using System.Collections.Generic;
using System.Text;
using System.IO;
using iTextSharp.text;
using iTextSharp.text.pdf;


namespace ConsoleApplication2
{
    class Program
    {
        static void Main(string[] args)
        {
            Console.WriteLine("读取PDF文档");
            try
            {
                // 创建一个PdfReader对象
                PdfReader reader = new PdfReader(@"C:\WS.pdf");

展开

收起

kun坤 2020-06-06 15:17:33 1402 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

kun坤

PDF 文档受损？还是需要密码之类的？######

pdf没有加密，用wordpad.exe打开

%PDF-1.5
%âãÏÓ
29 0 obj <</Linearized 1/L 306899/O 31/E 2477/N 2/T 306272/H [ 476 202]>>
endobj

.......

###### 请问第一步是不是还要先处理 PDF extraction 啊？

2020-06-06 15:17:40

赞同展开评论

问答分类：

C#

问答标签：

PDF文档 PDF文本 PDF报错 PDF读取 PDF内容

问答地址：

开发者社区 > 开发与运维 > 问答

相关问答

云虚拟主机是否有asp生成pdf文档组件

89

1

0

阿里云有没有什么产品能把身份证照片识别出来，进行抠图处理，再拼接成pdf文档的。类似全能扫描王类那种

42

0

0

AddFile接口上传pdf文档找不到入参category

287

1

0

通过oss url pdf 转png 报错SSLException

187

1

0

AddFile接口上传pdf文档会解析失败

677

3

0

访问CDN中图片显示跨域问题，而PDF文档正常的情况怎么解决？

134

0

0

在云效中有能从pdf里拆分文本和图片的接口吗?

94

1

0

在文档智能中咱们文档转换不支持pdf转ppt吗？

149

1

0

智能媒体管理pdf转码txt，生成文本无内容，帮忙排查下？

65

0

0

文档智能 api文档里有word，测试页面只能是图片类或pdf，这个接口到底是否支持word文件？

141

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

PolarDB这个PXD部署这个端口可以指定吗？

通义灵码启动异常，可点击按钮进行一键修复，如仍无法解决，请参考[问题排查指南](https://he

关于idea lingma欺骗的对话。请开发者尽快修复

怎么搭建本地文生图工作流

通义灵码提示看起来我们今天已经有了很多的对话，我很感谢你的热情，但我现在需要稍微休息一下。提前抱

相关文章

PVS‑Studio 7.40 发布 - 代码质量安全静态分析

阿里云最新域名注册续费收费标准，域名优惠口令及口令使用教程

C#实现的全能HTTP POST工具类

深入理解C#密封类（sealed）——掌握C#密封类的使用场景与设计限制

一个 .NET 开源免费、功能强大的 UI 自动化库

还有其他疑问?