如何使用Java读取PPT文本和图片

所属分类: 软件编程 / java 阅读数: 40
收藏 0 赞 0 分享

前言

本篇文章将介绍通过Java程序来读取PPT幻灯片中的文本及图片的方法。读取图片时,可读取文档中的所有图片,也可以读取指定幻灯片当中的图片。

工具:

  • Free Spire.Presentation for Java(免费版)
  • IntelliJ IDEA

Jar文件获取及导入

方法1:官网下载jar文件包。下载后,解压文件,并在java程序中导入lib文件夹下的Spire.Presentation.jar文件。

方法2:可通过maven仓库导入到maven项目

Java代码示例

测试文档:

【示例1】读取PPT中的文本

import com.spire.presentation.IAutoShape;
import com.spire.presentation.ISlide;
import com.spire.presentation.ParagraphEx;
import com.spire.presentation.Presentation;
import java.io.FileWriter;

public class ExtractText {
 public static void main(String[]args) throws Exception{
  //加载测试文档
  Presentation ppt = new Presentation();
  ppt.loadFromFile("test.pptx");

  StringBuilder buffer = new StringBuilder();

  //遍历文档中的幻灯片,提取文本
  for (Object slide : ppt.getSlides()) {
   for (Object shape : ((ISlide) slide).getShapes()) {
    if (shape instanceof IAutoShape) {
     for (Object tp : ((IAutoShape) shape).getTextFrame().getParagraphs()) {
      buffer.append(((ParagraphEx) tp).getText());
     }
    }
   }
  }
  //保存到文本文件
  FileWriter writer = new FileWriter("ExtractText.txt");
  writer.write(buffer.toString());
  writer.flush();
  writer.close();
 }
}

文本读取结果:

【示例2】读取PPT中的所有图片

import com.spire.presentation.Presentation;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.File;

public class ExtractAllImgs {
 public static void main(String[] args) throws Exception {
  //加载文档
  Presentation ppt = new Presentation();
  ppt.loadFromFile("test.pptx");

  //提取文档中的所有图片
  for (int i = 0; i < ppt.getImages().getCount(); i++) {
   BufferedImage image = ppt.getImages().get(i).getImage();
   ImageIO.write(image, "PNG", new File(String.format("AllImage-%1$s.png", i)));
  }
 }
}

【示例3】读取指定幻灯片中的图片

import com.spire.presentation.*;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.File;

public class ExtractImgsInSpecifiedSlide {
 public static void main(String[]args) throws Exception{
  //加载文档
  Presentation ppt = new Presentation();
  ppt.loadFromFile("test.pptx");

  //获取第2张幻灯片
  ISlide slide = ppt.getSlides().get(1);

  //提取图片
  for(int i = 0; i< slide.getShapes().getCount(); i++)
  {
   IShape shape = slide.getShapes().get(i);
   if(shape instanceof SlidePicture)
   {
    SlidePicture pic = (SlidePicture) shape;
    BufferedImage image = pic.getPictureFill().getPicture().getEmbedImage().getImage();
    ImageIO.write(image, "PNG", new File(String.format("extractImageinslide-%1$s.png", i)));
   }
   if(shape instanceof PictureShape)
   {
    PictureShape ps = (PictureShape) shape;
    BufferedImage image = ps.getEmbedImage().getImage();
    ImageIO.write(image, "PNG", new File(String.format("extractImageinslide-%1$s.png", i)));
   }
  }

 }
}

图片读取结果:

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。

更多精彩内容其他人还在看

浅谈spring注解之@profile

这篇文章主要介绍了浅谈spring注解之@profile,@profile通过配置来改变参数,这里整理的详细的用法,有兴趣的可以了解一下
收藏 0 赞 0 分享

Java this 关键字的使用方法详解

这篇文章主要介绍了Java this 关键字的使用方法详解的相关资料,希望通过本文能帮助到大家,让大家彻底理解掌握这部分内容,需要的朋友可以参考下
收藏 0 赞 0 分享

Java super关键字的使用方法详解

这篇文章主要介绍了Java super关键字的使用方法详解的相关资料,希望通过本文能帮助到大家,让大家对super关键字彻底掌握,需要的朋友可以参考下
收藏 0 赞 0 分享

springboot整合redis进行数据操作(推荐)

springboot整合redis比较简单,并且使用redistemplate可以让我们更加方便的对数据进行操作。下面通过本文给大家分享springboot整合redis进行数据操作的相关知识,感兴趣的朋友一起看看吧
收藏 0 赞 0 分享

java实现简单解析XML文件功能示例

这篇文章主要介绍了java实现简单解析XML文件功能,结合实例形式分析了java针对xml文件的读取、遍历节点及输出等相关操作技巧,需要的朋友可以参考下
收藏 0 赞 0 分享

Spring Java-based容器配置详解

这篇文章主要介绍了Spring Java-based容器配置详解,涉及注解和@Configuration类以及@Beans的相关知识,具有一定参考价值,需要的朋友可以了解。
收藏 0 赞 0 分享

java实现MD5加密的方法小结

这篇文章主要介绍了java实现MD5加密的方法,结合具体实例形式总结分析了java实现md5加密的常用操作技巧与使用方法,需要的朋友可以参考下
收藏 0 赞 0 分享

使用maven运行Java Main的三种方法解析

这篇文章主要介绍了使用maven运行Java Main的三种方式的相关内容,具有一定参考价值,需要的朋友可以了解下。
收藏 0 赞 0 分享

javaweb设计中filter粗粒度权限控制代码示例

这篇文章主要介绍了javaweb设计中filter粗粒度权限控制代码示例,小编觉得还是挺不错的,需要的朋友可以参考。
收藏 0 赞 0 分享

java 流操作对文件的分割和合并的实例详解

这篇文章主要介绍了java 流操作对文件的分割和合并的实例详解的相关资料,希望通过本文能帮助到大家,让大家理解掌握这部分内容,需要的朋友可以参考下
收藏 0 赞 0 分享
查看更多