感悟网 导航

如何把视频里的文字提取出来,做成WORD格式的?急啊,帮帮忙啊 如何将rmvb格式影片中的字幕提取出来并作成word或txt...

作者&投稿:晁儿 (若有异议请与网页底部的电邮联系)
如何将视频里的字幕转化或者弄成word的形式~

“随身录”的录音转文字功能,导入视频文件,点开文件,界面下方有“转文本”功能。转成文字之后可以以字幕格式显示,也能以文稿形式编辑、拷贝和分享!方便快捷、一步搞定!苹果手机在AppStore直接搜索和下载。“随身录”把自带的“小黑”不知道甩了多少条街!






1、首先从rmvb格式影片中将字幕以srt格式提取出来,打开aegisub软件,将srt字幕拖入软件。

2、右键点击下方,在弹出菜单中取消选中开始时间、结束时间。

3、然后点击上方菜单栏的“文件”选项。

4、在弹出菜单中,点击“导出字幕”。

5、在“导出”窗口,点击导出按钮。

6、然后在“导出字幕文件”窗口,输入文件名,将保存类型设置为txt。

7、点击保存后,即可成功地将字幕提取出来并做成txt文件。

1、下载蜜蜂剪辑软件。

2、首先打开软件,点击界面内“文件-导入-导入文件”,将我们需要提取的视频文件导入。

3、点击视频素材区的视频文件,右键后选择“添加至轨道”将视频添加至视频轨道,我们便在下方可以看到我们添加可修改的视频

4、之后我们单击下方轨道上面的视频,接着点击“导出”

5、最后我们在弹出的窗口选择“音频”,MP3格式,输入“名称”,选择输出目录,最后单击导出,我们的视频音频便导出到我们指定的文件夹中了

6、打开免费在线音视频转换页面。

7、在浏览器内打开它的在线音视频转换界面后,点击“点此导入文件”,将我们需要提取音频的视频文件导入平台内。

8、在点击界面下方的“格式”,选择我们想要输出的音频格式后,点击界面右下角的“转换”按钮后,视频中的音频即可实现音视频分离。



整体处理流程

docx文档格式简介
首先,为你大致介绍下docx文档格式。docx其实是一个压缩格式文件,手工将后缀修改为zip后,即可解压该文件。通常主要的内容结构都在解压后的word/document.xml 文件中。

例如,下图是一个最简单的word文档,正文只有“你好”两个字:

docx示例文档

将该文档后缀修改为.zip后,解压该文档,会看到word/document.xml的主要内容如下

<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<w:document
xmlns:mc="http://schemas.openxmlformats.org/markup-compatibility/2006"
xmlns:w="http://schemas.openxmlformats.org/wordprocessingml/2006/main"
xmlns:w14="http://schemas.microsoft.com/office/word/2010/wordml"
mc:Ignorable="w14 w15 w16se w16cid w16 w16cex wp14">
<w:body>
<w:p w14:paraId="6D5AFF05" w14:textId="678C6FAC" w:rsidR="000933A6" w:rsidRDefault="008D746B">
<w:r>
<w:rPr>
<w:rFonts w:hint="eastAsia"/>
</w:rPr>
<w:t>你好</w:t>
</w:r>
</w:p>
</w:body>
</w:document>
从上面文件可以大致看出word文档基本构造:

<w:p>是段落
<w:r>是段落中的行
<w:rPr>是行样式信息
<w:t>是文本内容
docx4j库的基本逻辑与上述xml组织结构是对应的:将上述xml的内容,转换为对应的java对象及方法,实现文档生成、编辑等功能。

docx4j文档操作
接下来基于docx4j库,实现word文档操作。

首先,引入docx4j依赖:

<groupId>org.docx4j</groupId>
<artifactId>docx4j-JAXB-ReferenceImpl</artifactId>
<version>8.1.6</version>
首先,我们要将每个视频文件的对话记录,生成如下模式的表格:

内容表格示例

对应表格的处理逻辑是:

// 创建表头
Tbl tbl = Context.getWmlObjectFactory().createTbl();
//设置表格基本样式,包括边框等
String strTblPr = "<w:tblPr "
+ Namespaces.W_NAMESPACE_DECLARATION
+ ">"
+ "<w:tblStyle w:val=\"TableGrid\"/>"
+ "<w:tblW w:w=\"0\" w:type=\"auto\"/>"
+ "<w:tblLook w:val=\"04A0\"/>"
+ "</w:tblPr>";
try {
TblPr tblPr = (TblPr) XmlUtils.unmarshalString(strTblPr);
tbl.setTblPr(tblPr);
} catch (JAXBException e) {
log.error("基于XML解析生成TblPr出错", e);
}

// 设置标题行
Tr hearTr = Context.getWmlObjectFactory().createTr();
tbl.getContent().add(hearTr);
geneTblHearderCell(hearTr, "D9D9D9", 2629, docPart.createParagraphOfText("时间"));
geneTblHearderCell(hearTr, "D9D9D9", 5667, docPart.createParagraphOfText("内容"));

// 设置内容行
taskResultRepo.findByTaskIdEqualsOrderByBeginTimeAsc(taskId).forEach(result -> {
Tr tr = Context.getWmlObjectFactory().createTr();
tbl.getContent().add(tr);

//创建第一个单元格
Tc tc1 = Context.getWmlObjectFactory().createTc();
tc1.getContent().add(docPart.createParagraphOfText(formatSecond(result.getBeginTime())));

//创建第二个单元格
Tc tc2 = Context.getWmlObjectFactory().createTc();
tc2.getContent().add(docPart.createParagraphOfText(result.getWords()));

//将单元格加入到表格中
tr.getContent().addAll(Arrays.asList(tc1, tc2));
});
//将表格加入到文档中
docPart.getContent().add(tbl);
//增加分页符
docPart.getContent().add(createNextPage());
有一点特别提醒下,建议尽量不要使用XmlUtils.unmarshalString来生成对象,除了上述参考官方示例在创建表头TblPr外,本项目所有其他结构,均是采用java对象来构建。原因是直接基于xml解析,很容易出现命名空间的错误。

docx4j还支持将图片入到文档中,例如:

//将图片写入到word文档中
Inline inline = null;
try {
BinaryPartAbstractImage imagePart = BinaryPartAbstractImage.createImagePart(wordPackage,
Files.readAllBytes(Paths.get("doc\\thomas-gitee.png")));
inline = imagePart.createImageInline("开源工程地址", "二维码图片", 1, 2, false);
} catch (Exception e) {
log.error("创建图片对象出现异常", e);
}

ObjectFactory factory = Context.getWmlObjectFactory();
P p = factory.createP();
R r = factory.createR();
p.getContent().add(r);
Drawing drawing = factory.createDrawing();
r.getContent().add(drawing);
drawing.getAnchorOrInline().add(inline);
以下是设置标题及章节,分别将内容样式设置为Title和Heading1即可:

//设置文档标题
mainDocumentPart.addStyledParagraphOfText("Title", THOMAS_DOCX_NAME);
//取出第一行,作为章节名称
mainDocumentPart.addStyledParagraphOfText("Heading1", taskInfo.getTaskName());
生成目录也很简单:

//生成目录,该段内容要放到最后面
Toc.setTocHeadingText("目录");
TocGenerator tocGenerator = new TocGenerator(wordPackage);
tocGenerator.generateToc(5, " TOC \\o \"1-3\" \\h \\z \\u ", true);
需要提醒的是,generateToc方法中的第一个参数是将目录入到文档中的位置,上述代码是将目录插入到第五个位置。

文档结构组装完成后,直接WordprocessingMLPackage的save方法即可保存文档。

最后
至此,我们终于完成将MP4视频中的对话,最终转化为文字,并且输出为一个格式规范的word文档,实现过程如有有错漏之处,敬请反馈,谢谢。

如何把视频里的文字提出来?额,你可以看一下他的。哦,把视频分解把他的那个字幕文件给提炼出来,或者他本身是有字幕文件下载的时候是有分别出来的话就可以直接。去编辑那个字幕文件用。AI就可以做到这个功能了。因为就是这个就是视频编辑专门用的软件。

把视频里的文字提取出来需要专业的软件,最简单的办法是到射手网(http://www.shooter.cn/)下载对应的视频字幕文件,复制到WORD文档就可以了

如果视频有独立字幕的,我会用MKVToolNix工具提取字幕文件。
如果是合成字幕的, 我会用迅飞语音输入方法,将字幕读出,转换为文字,编辑粘贴到WORD中。

《4种最简单的视频文字提取软件,一分钟学会提取文字》
答:下载并安装导入音频文件,等待识别和转换提取完成后,选择保存格式或复制粘贴到其他文档3. 迅捷语音转文字工具 作为智能助手,迅捷提供高效语音识别,将视频中的语音无缝转化为文本。下面是它的操作步骤:安装软件,导入视频稍等片刻,提取文字并保存或复制4. 网易见外视频文字提取软件 网易见外以高精度的算法...

《8种免费的视频转文字提取方法,一键提取视频文字》
答:方法一:智能语音转字幕语音识别技术的迅猛发展,让自动字幕生成变得轻而易举。只需启动语音识别软件,导入视频,它能瞬间将语音内容转化为文字,高效且快速。方法二:专用视频文案工具为视频定制的专业工具,精准捕捉语音中的每个字句。只需复制视频链接,导入工具,一键启动提取,确保信息的准确性和高效性。...

《视频里的文字如何提取出来》
答:视频里的文字提取方法如下:1. 准备工具:视频播放器、屏幕录制软件、视频编辑软件(如Adobe Premiere Pro等)。2. 打开视频播放器并播放视频,同时使用屏幕录制软件记录视频画面。3. 在录制过程中,同时使用视频编辑软件将视频中的音频分离出来,并将音频保存为MP3格式。4. 打开文本编辑器(如Microsoft W...

《怎么把视频里的文字提取出来》
答:把视频里的文字提取出来需要在视频转文字界面中,点击视频转文字选择视频即可。以iPhone 12手机为例,表情包保存到手机相册的步骤为4步,具体操作如下:1点击本地视频 在视频转文字界面中,点击本地视频。2点击视频 在展开的界面中,点击视频。3点击确定 在选择后,点击确定。4查看文字 在展开的界面中,...

《剪映怎么提取视频里的文字》
答:-- 1第1步 点击开始创作 -- 在剪映首页的界面中,点击开始创作。2 勾选视频 !-- 2第2步 勾选视频 -- 在照片视频的界面中,勾选要制作的视频。剪映怎么识别字幕? 打开剪映,点击中央的开始创业,将视频导入进去后选择添加-文字。找到识别文字,按照需求设置需要的字幕,点击开始识别即可...

《如何将视频中的文字提取出来?》
答:1、首先打开剪映。2、点击开始创作。3、点击选择视频文件,添加到项目。4、点击页面下方的“文字”标志。5、在页面中间的空白处,点击输入想要上传的文字,然后点击对勾进行确认。6、点击文本,用手指按在文本文件的末端白框向后移动。7、一直移动到视频文件的末尾。8、这样文字就从头到尾显示在屏幕上了...

《如何提取视频中的文字》
答:提取视频中文字的方法如下:工具:OPPOReno7、ColorOS12.1、剪映8.9.0。1、打开剪映软件,点击开始创作选项。2、将需要提取文字的视频导入剪映,点击添加选项。3、点击文字选项。4、然后点击识别字幕选项。5、在弹出的对话框中,点击开始识别选项。6、最后即可查看视频中被提取出的文字。

《如何把视频上的字弄到图片上》
答:把视频中的文字提取出来,只需要在文字下进行语音识别即可,以下是具体的操作步骤:工具/原料:华为nova8 EMUI11 美图秀秀9.3.6.0 1、点击视频编辑 在美图秀秀首页,点击视频编辑。2、点击文字 导入视频后,点击文字。3、点击语音识别 在文字页面,点击语音识别。4、点击开始识别 在语音识别页面,点击...

《剪映怎么提取文字》
答:很多人不知道剪映怎么提取文字,接下来6个步骤将具体给您介绍。 1、在软件页面,点击【开始创作】。 2、在视频页面,选择【视频】,点击【添加】。 3、完成视频导入,点击【文字】。 4、在文字页面,点击【识别字幕】。 5、在自动识别字幕页面,单击【开始识别】。 6、这样就成功自动识别文字。 3 已赞过 已踩过<...

《怎么把视频里的文字提出来》
答:将视频中的文字提取出来,需要借助一些专业的工具和技术。以下是几个步骤和工具供参考:1. 准备好所需的工具:视频文字提取的工具通常需要支持视频播放和文本识别功能。常见的工具包括 OCR(Optical Character Recognition)软件、视频编辑软件等。2. 将视频导入工具中:将视频文件导入到相应的工具中,确保...

   

返回顶部
本页内容来自于网友发表,若有相关事宜请照下面的电邮联系
感悟网