C#提取PPT文本和图片的实现方法

所属分类: 软件编程 / C#教程 阅读数: 124
收藏 0 赞 0 分享

在图文混排的文档中,我们可以根据需要将文档中的文字信息或者图片提取出来,通过C#代码可以提取Word和PDF文件中的文本和图片,那么同样的,我们也可以提取PPT幻灯片当中的文本和图片。本篇文档将讲述如何使用C#来实现提取PPT文本和图片的操作。首先也是需要安装组件Spire.Presentation,然后添加引用dll文件到项目中。下面是主要的代码步骤。

原文档:

1. 提取文本

步骤一:创建一个Presentation实例并加载文档

Presentation presentation = new Presentation(@"C:\Users\Administrator\Desktop\sample.pptx", FileFormat.Pptx2010);

步骤二:创建一个StringBuilder对象

StringBuilder sb = new StringBuilder(); 

步骤三:遍历幻灯片及幻灯片中的图形,提取文本内容

 foreach (ISlide slide in presentation.Slides)
  {
  foreach (IShape shape in slide.Shapes)
  {
   if (shape is IAutoShape)
   {
   foreach (TextParagraph tp in (shape as IAutoShape).TextFrame.Paragraphs)
   {
    sb.Append(tp.Text + Environment.NewLine);
   }
   }
  }
  }

步骤四:写入Txt文档

 File.WriteAllText("target.txt", sb.ToString());
 Process.Start("target.txt");

2. 提取图片

 这里提取图片有两种情况,一种是提取整个文档中的所有图片,另外一种是只提取文档中某一特定幻灯片中的图片。

2.1提取所有图片

步骤一:初始化一个Presentation类实例,并加载文档

Presentation ppt = new Presentation();
 ppt.LoadFromFile(@"C:\Users\Administrator\Desktop\sample.pptx");

步骤二:遍历文档中图片,提取图片并保存

 for (int i = 0; i < ppt.Images.Count; i++)
 {
 Image image = ppt.Images[i].Image;
 image.Save(string.Format(@"..\..\Images{0}.png", i));
 }

提取的图片已保存到项目文件夹下

2.2.提取特定幻灯片中的图片

步骤一:创建一个Presentation类实例,并加载文档

Presentation PPT = new Presentation();
PPT.LoadFromFile(@"C:\Users\Administrator\Desktop\sample.pptx");

步骤二:获取第三张幻灯片,提取并保存图片

int i = 0;
foreach (IShape s in PPT.Slides[2].Shapes)
{
 if (s is SlidePicture)
 {
 SlidePicture ps = s as SlidePicture;
 ps.PictureFill.Picture.EmbedImage.Image.Save(string.Format("{0}.png", i));
 i++;
 }
 if (s is PictureShape)
 {
 PictureShape ps = s as PictureShape;
 ps.EmbedImage.Image.Save(string.Format("{0}.png", i));
 i++;
 }
}

提取的第三张幻灯片中的图片已保存至指定位置

上文演示了如何提取文本和图片,步骤比较简单实用,希望对你有所帮助,感谢阅读!

更多精彩内容其他人还在看

c#开发word批量转pdf源码分享

已经安装有Office环境,借助一些简单的代码即可实现批量Word转PDF,看下面的实例源码吧
收藏 0 赞 0 分享

c# xml API操作的小例子

这篇文章主要介绍了c# xml API操作的小例子,有需要的朋友可以参考一下
收藏 0 赞 0 分享

c#唯一值渲染实例代码

这篇文章主要介绍了c#唯一值渲染实例代码,有需要的朋友可以参考一下
收藏 0 赞 0 分享

淘宝IP地址库采集器c#代码

这篇文章主要介绍了淘宝IP地址库采集器c#代码,有需要的朋友可以参考一下
收藏 0 赞 0 分享

C#在后台运行操作(BackgroundWorker用法)示例分享

BackgroundWorker类允许在单独的专用线程上运行操作。如果需要能进行响应的用户界面,而且面临与这类操作相关的长时间延迟,则可以使用BackgroundWorker类方便地解决问题,下面看示例
收藏 0 赞 0 分享

c#文本加密程序代码示例

这是一个加密软件,但只限于文本加密,加了窗口控件的滑动效果,详细看下面的代码
收藏 0 赞 0 分享

c#生成站点地图(SiteMapPath)文件示例程序

这篇文章主要介绍了c#生成站点地图(SiteMapPath)文件的示例,大家参考使用
收藏 0 赞 0 分享

C# 键盘Enter键取代Tab键实现代码

这篇文章主要介绍了C# 键盘Enter键取代Tab键实现代码,有需要的朋友可以参考一下
收藏 0 赞 0 分享

C# WinForm导出Excel方法介绍

在.NET应用中,导出Excel是很常见的需求,导出Excel报表大致有以下三种方式:Office PIA,文件流和NPOI开源库,本文只介绍前两种方式
收藏 0 赞 0 分享

C#串口通信程序实例详解

在.NET平台下创建C#串口通信程序,.NET 2.0提供了串口通信的功能,其命名空间是System.IO.Ports,创建C#串口通信程序的具体实现是如何的呢?让我们开始吧
收藏 0 赞 0 分享
查看更多