没有找到合适的产品?
联系客服协助选型:023-68661681
提供3000多款全球软件/控件产品
针对软件研发的各个阶段提供专业培训与技术咨询
根据客户需求提供定制化的软件开发服务
全球知名设计软件,显著提升设计质量
打造以经营为中心,实现生产过程透明化管理
帮助企业合理产能分配,提高资源利用率
快速打造数字化生产线,实现全流程追溯
生产过程精准追溯,满足企业合规要求
以六西格玛为理论基础,实现产品质量全数字化管理
通过大屏电子看板,实现车间透明化管理
对设备进行全生命周期管理,提高设备综合利用率
实现设备数据的实时采集与监控
利用数字化技术提升油气勘探的效率和成功率
钻井计划优化、实时监控和风险评估
提供业务洞察与决策支持实现数据驱动决策
翻译|使用教程|编辑:胡涛|2022-08-30 10:42:23.883|阅读 210 次
概述:本文将向您展示如何使用 doc.GetText() 的方法直接从包含文本、图像和表格的 word 文档中提取文本。更方便开发者从代码中提取word文档中的文本。
# 界面/图表报表/文档/IDE等千款热门软控件火热销售中 >>
相关链接:
Spire.Doc for .NET是一款专门对 Word 文档进行操作的 .NET 类库。在于帮助开发人员无需安装 Microsoft Word情况下,轻松快捷高效地创建、编辑、转换和打印 Microsoft Word 文档。拥有近10年专业开发经验Spire系列办公文档开发工具,专注于创建、编辑、转换和打印Word/PDF/Excel等格式文件处理,小巧便捷。
有时我们在处理信息量很大的word文档时,只需要从word文档中获取文本以供其他使用。在 Spire.Doc 的帮助下,我们已经演示了如何通过遍历 word 文档中的每个段落然后相应地附加文本来从 word 文档中提取文本。本文将向您展示如何使用 doc.GetText() 的方法直接从包含文本、图像和表格的 word 文档中提取文本。更方便开发者从代码中提取word文档中的文本。
第 1 步:创建一个 word 实例并从文件中加载源 word 文档。
Document doc = new Document(); doc.LoadFromFile("Sample.docx");
第 2 步:调用 doc.GetText() 方法从 word 文档中获取所有文本。
string s = doc.GetText();
第 3 步:创建一个新的 TEXT 文件以保存提取的文本。
File.WriteAllText("Extract.txt", s.ToString());
从word文档中获取所有文本后的有效截图:
完整代码:
using Spire.Doc; using System.IO; namespace GetText { class WordText { public void GetText() { Document doc = new Document(); doc.LoadFromFile("Sample.docx"); string s = doc.GetText(); File.WriteAllText("Extract.txt", s.ToString()); } } }
以上便是如何在C#中获取word文档中的文本,如果您有其他问题也可以继续浏览本系列文章,获取相关教程,你还可以给我留言或者加入我们的官方技术交流群。
欢迎下载|体验更多E-iceblue产品
获取更多信息请咨询慧都在线客服 ;技术交流Q群(767755948)
本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处、不得修改原文相关链接,如果存在内容上的异议请邮件反馈至chenjj@evget.com
本文将详细介绍如何使用 Spire.Doc for Python 库在 Python 中读取 Word 文档(包括 .doc 和 .docx 格式),并演示如何提取文本、图片、表格、批注、列表以及文档的元数据等信息。无论您是进行文档内容抓取、自动化报告生成,还是开发文档解析工具,本教程都将提供清晰的代码示例和实用指导。
从图像中提取文本是企业应用程序和日常生产力任务中的常见需求。在本文中,我们将探讨如何使用 Aspose.OCR 将图像文本转换为可编辑文本。请按照本分步指南,使用 Python、 C#、Java 构建您自己的图像文本到文本转换工具。
DevExpress v25.1帮助文档正式发布上线了,请按版本按需下载~
本教程将为大家介绍如何使用MyEclipse创建企业应用项目目,欢迎下载最新版IDE体验!
Spire.Doc for .NET 是一款专门对 Word 文档进行操作的 .NET 类库。
Spire.XLS for .NETSpire.XLS for .NET是专业.NET Excel组件,快速完成对Excel各类编程操作
Spire.Office for .NET专业的.NET Office套件,涵盖office文档创建、编辑、转换、管理和OCR内容识别等操作
Aspose.Words for .NET无需Microsoft Word也可在任何平台上满足Word文档的一切操作需求。
Aspose.PDF for .NETPDF文档创建组件,无需Adobe Acrobat,也可以在任何平台上操作PDF文档。
服务电话
重庆/ 023-68661681
华东/ 13452821722
华南/ 18100878085
华北/ 17347785263
客户支持
技术支持咨询服务
服务热线:400-700-1020
邮箱:sales@evget.com
关注我们
地址 : 重庆市九龙坡区火炬大道69号6幢
慧都科技 版权所有 Copyright 2003-
2025 渝ICP备12000582号-13 渝公网安备
50010702500608号