文档帮助中心文档
从PDF表单读取数据
data = readPDFFormData(文件名)
data = readPDFFormData(文件名,密码,密码)
例子
数据= readPDFFormData (文件名)将数据从PDF表单读入结构体。
数据= readPDFFormData (文件名)
数据
文件名
数据= readPDFFormData (文件名“密码”,密码)指定打开PDF表单的密码。
数据= readPDFFormData (文件名“密码”,密码)
密码
全部折叠
从表单字段读取数据weatherReportForm1.pdf使用readPDFFormData.函数返回一个包含来自PDF表单字段的数据的结构体。
weatherReportForm1.pdf
readPDFFormData
文件名=“weatherReportForm1.pdf”;data = readPDFFormData(文件名)
data =结构体字段:event_type:“雷暴风”event_narrative:“Plantersville和Nettleton之间的大树倒下了。”
使用文件数据存储从多个文件中的表单字段读取数据。
为天气报告表单创建文件数据存储。表单被命名为“weatherReportFormN.pdf”,在那里N是表格的号码。使用通配符“*”指定文件名,以查找此结构的所有文件名。指定要读取的函数readPDFFormData,输入此函数fileDatastore使用函数句柄。
“weatherReportFormN.pdf”
N
fileDatastore
fds = fileDatastore (“weatherReportForm * . pdf”,“ReadFcn”@readPDFFormData)
/tpdf7af6b0/textanalytics-ex39762425/weatherReportForm1.pdf';“…/ tpdf7af6b0 / textanalytics-ex39762425 / weatherReportForm2.pdf”;“…/ tpdf7af6b0 / textanalytics-ex39762425 / weatherReportForm3.pdf”……and 1 more} Folders: {'/tmp/Bdoc21a_1606923_11852/tpdf7af6b0/textanalytics-ex39762425'} UniformRead: 0 ReadMode: 'file' BlockSize: Inf PreviewFcn: @readPDFFormData Sup万博1manbetxportedOutputFormats: [1x16 string] ReadFcn: @readPDFFormData AlternateFileSystemRoots: {}
循环遍历数据存储中的文件并读取每个PDF表单。
数据= [];而hasdata(fds) textData = read(fds);data =[数据;textData];结束数据
data =4×1带有字段的结构数组:event_type event_narrative
文件的名称,指定为字符串标量或字符向量。
readPDFFormData万博1manbetx只支持AcroForm PDF档案(交互式表格)。
数据类型:字符串|字符
字符串
字符
打开PDF文件的密码,指定为字符向量或字符串标量。
例子:“skroWhtaM”
“skroWhtaM”
输出结构。等领域的数据对应于PDF中表单字段的名称。如果表单字段名不是有效的结构字段名,那么该函数将自动编辑它们以构造有效的名称。
extractFileText|extractHTMLText|readPDFFormData|tokenizedDocument|writeTextDocument
extractFileText
extractHTMLText
tokenizedDocument
writeTextDocument
您有这个示例的修改版本。您想打开这个示例与您的编辑吗?
你点击一个链接对应于这个MATLAB命令:
通过在MATLAB命令窗口中输入命令来运行命令。Web浏览器不支持MATLAB命令。万博1manbetx
选择一个网站,在那里获得翻译的内容,并看到当地的活动和优惠。根据您的位置,我们建议您选择:.
你也可以从以下列表中选择一个网站:
选择中国网站(中文或英文)以获得最佳网站性能。其他MathWorks国家站点没有针对您所在位置的访问进行优化。
与当地办事处联系