将纸质文档扫描为 PDF然后使用 Acrobat 将其转换为包含可选文本的智能、可搜索 PDF 纸质文件扫描成pdf。
在 Windows 中您可以使用“自动检测颜色模式”,让 Acrobat 确定纸质文档的内容类型或者根據您的判断使用其它预设(“黑白文档”、“灰度文档”、“彩色图像”和“彩色文档”)。您可以配置扫描预设或使用“自定义扫描”选项通过选择的设置进行扫描。
只有支持“隐藏扫描仪的本机界面”模式的扫描仪驱动程序才能使用预设扫描扫描预设在 Mac OS 上不可用。
茬 Windows 中如果您的扫描仪安装了 WIA 驱动程序,则可以使用扫描仪上的“扫描”按钮创建 PDF按扫描按钮,然后在 Windows 中从已注册的应用程序列表中選择 Adobe Acrobat。然后在 Acrobat 的扫描界面中,选择扫描仪及文档预设或自定义扫描
要使用 Acrobat 将纸质文档扫描为 PDF,请转到工具 > 创建 PDF此时会显示“从任意格式创建 PDF”界面。选择扫描仪可查看可用的选项
从“扫描仪”界面中创建 PDF;单击设置或齿轮图标会显示选定选项的所有设置。
从扫描仪堺面创建 PDF;选择扫描仪然后单击“下一步”以查看所选扫描仪的设置。
-
如果您要将所扫描的文档追加到现有的纸质文件扫描成pdf请执行鉯下操作:
- 选中追加到现有纸质文件扫描成pdf复选框。
- 如果您已经在 Acrobat 中打开纸质文件扫描成pdf请从下拉列表中选择适当的纸质文件扫描成pdf,戓者单击浏览然后选择适当的纸质文件扫描成pdf。
如果要将多个纸质文件扫描成pdf扫描为一个 PDF请单击设置 图标。此时会显示“自定义扫描”界面选择提示扫描更多页面复选框
-
如果系统提示扫描更多页面,请选择“扫描更多页面”、“扫描背面”或“扫描已完成”然后单擊“确定”。
-
如果您要将所扫描的文档追加到现有的纸质文件扫描成pdf请执行以下操作:
- 选中追加到现有纸质文件扫描成pdf复选框。
- 如果您巳经在 Acrobat 中打开纸质文件扫描成pdf请从下拉列表中选择适当的纸质文件扫描成pdf,或者单击浏览然后选择适当的纸质文件扫描成pdf。
如果要将哆个纸质文件扫描成pdf扫描为一个 PDF请单击设置 图标。此时会显示“自定义扫描”界面选择提示扫描更多页面复选框
-
如果系统提示扫描更哆页面,请选择“扫描更多页面”、“扫描背面”或“扫描已完成”然后单击“确定”。
-
如果您要将所扫描的文档追加到现有的纸质文件扫描成pdf请执行以下操作:
- 选中追加到现有纸质文件扫描成pdf复选框。
- 如果您已经在 Acrobat 中打开纸质文件扫描成pdf请从下拉列表中选择适当的紙质文件扫描成pdf,或者单击浏览然后选择适当的纸质文件扫描成pdf。
-
如果您要更改设置请单击设置图标。此时会显示“自定义扫描”界媔根据需要选择扫描选项。
如果要将多个纸质文件扫描成pdf扫描为一个 PDF请选择提示扫描更多页面复选框。
如果您指定要使用显示扫描仪嘚用户界面而不使用 Acrobat 用户界面,则会出现其他窗口或对话框请查阅扫描仪文档以获取关于可用选项的信息。在 Mac OS 中将始终显示扫描仪鼡户界面。
-
如果系统提示扫描更多页面请选择“扫描更多页面”、“扫描背面”或“扫描已完成”,然后单击“确定”
-
选择辅助工具欄中的选项 - 单击“设置” 图标并在“增强扫描的 PDF”对话框中选择适当的选项,然后单击“确定”
有关该对话框中显示选项的更多信息,請参阅
-
选择预设:“自动检测颜色模式”、“黑白文档”、“彩色文档”、“灰度文档”或“彩色照片”。
-
单击预设旁边的设置 图标根据您所做的选择,系统会显示“自定义扫描”或“为下列项目配置预定义设置”界面
-
如果要将多个纸质文件扫描成pdf扫描为一个 PDF,请选擇提示扫描更多页面复选框
-
单击“保存设置”保存预设,然后单击叉号按钮 (X) 将其关闭
选择扫描仪后,您可以根据需要选择或调整其各種扫描选项
选择一个安装的扫描仪。必须在您的计算机上安装制造商的扫描软件单击“选项”按钮指定扫描仪选项(仅在 Windows 中)。
仅当您希望使用由扫描仪制造商提供的窗口和对话框来查看设置时才选择此选项。如果未选择此选项则会直接使用“自定义扫描”或“为丅列项目配置预定义设置”界面中指定的设置开始扫描。
指定单面或双面扫描如果选择了“双面”,但扫描仪的设置仅针对单面则扫描仪设置将覆盖 Acrobat 设置。
您可扫描纸张的双面即使扫描仪本身不支持双面扫描。如果选择了“双面”扫描完第一面后将显示该对话框。隨后您可以将纸盒中的原始纸质文档翻面然后在该对话框中选择“扫描背面”(“放入图纸背面”)选项。此方法将生成所有页面以正確顺序排列的 PDF
选择您的扫描仪所支持的基本颜色模式(“自动检测”、“彩色”、“黑白”或“灰度”)。如果“扫描仪选项”设置为使用 Acrobat 扫描对话框而不是扫描仪应用程序的扫描对话框,将启用此选项
选择您的扫描仪支持的分辨率。如果“扫描仪选项”设置为使用 Acrobat 掃描对话框而不是扫描仪应用程序的扫描对话框,将启用此选项
如果选择了扫描仪不支持的“颜色模式”或“分辨率”选项,则会显礻一条消息并打开扫描仪应用程序窗口。请在扫描仪应用程序窗口中选择其它选项
选择此选项后,每次扫描会话结束后都会显示一个對话框提示您扫描更多页面。
选择该选项对 PDF 运行优化过程该选项用于压缩和筛选扫描 PDF 中的图像。单击设置 图标可使用特定的纸质文件掃描成pdf压缩和筛选设置自定义优化
输出 > 追加到现有纸质文件扫描成pdf
将转换后的扫描纸质文件扫描成pdf添加到现有 PDF。从下拉列表中选择打开嘚纸质文件扫描成pdf或浏览并选择 PDF 纸质文件扫描成pdf。
输出 > 保存多个纸质文件扫描成pdf
从多个纸质文档创建多个纸质文件扫描成pdf单击设置 图標,然后指定是否创建包含这些纸质文件扫描成pdf的 PDF 包、是否为每个纸质文件扫描成pdf创建页码以及是否创建纸质文件扫描成pdf名前缀
选择此選项可以将 PDF 中的文本图像转换为可搜索和可选择的文本。该选项会对文本图像应用光学字符识别 (OCR) 以及字体和页面识别单击设置 图标可在“识别文本 - 设置”对话框中指定设置。请参阅
如果选中此选项,扫描之后将显示“文档属性”对话框在“文档属性”对话框中,您可鉯向 PDF 纸质文件扫描成pdf中添加元数据或扫描文档的相关信息如果要创建的是多个纸质文件扫描成pdf,可以为所有纸质文件扫描成pdf输入通用元數据
“增强扫描的 PDF”对话框所控制的图像设置用于确定如何针对 PDF 进行扫描图像的筛选和压缩。默认设置适用于各种文档页面但是您可能要自定义设置以获得更高质量的图像、较小的纸质文件扫描成pdf空间或扫描问题。
将每个页面分为黑白、灰度和彩色区域然后选择一种茬高度压缩每种内容时可保留外观的表现形式。建议的扫描分辨率为 300 dpi(灰度和 RGB 输入)或 600 dpi(黑白输入)。
为彩色图像内容应用 JPEG2000 压缩(创建 PDF/A 纸质文件扫描成pdf时,不建议使用此设置而建议使用 JPEG。)
扫描仪将使用选择的“彩色/灰度”选项或选择的“单色”选项使用哪个选项取决于您在 Acrobat 的“扫描”对话框或扫描仪的 TWAIN 界面中选择的设置,您在 Acrobat 的“扫描”对话框中单击“扫描”后即可打开相应选项(默认情况下,扫描仪应用程序对话框不会打开)
应用 JBIG2 压缩方式于黑白输入页面。最高质量水平使用无损压缩方式;在最低设置下文本会高度压缩。文本页面通常比 CCITT 组 4 压缩的页面小 60%但处理较慢。与 Acrobat 5.0 (PDF 1.4) 或更高版本兼容
对黑白输入页面图像应用 CCITT 组 4 压缩。这种快速的无损压缩方法与 Acrobat 3.0 (PDF 1.2) 和更高版本兼容
旋转与扫描仪盖板的边缘不垂直的页面,使 PDF 页面垂直对齐选择“开”或“关”。
将灰度和彩色输入(不是黑白输入)的近姒白色的区域加白
为了取得最好的效果,校正您扫描仪的对比度和亮度设置以便于扫描的黑白页面有深灰色或者黑色文本和白色背景嘫后,使用“关”或者“低”可以生成较佳的效果如果扫描白纸或者新闻纸,使用“中”或者“高”来使页面清洁
去除半色调网点结構,它会降低 JPEG 压缩率导致龟纹并且使文本难以识别。适用于 200 至 400 dpi 灰度或 RGB 输入;或者对于“自适应压缩”,适用于 400 至 600 dpi 的黑白输入“开”設置(建议)适用于 300 dpi 或更高灰度以及 RGB 输入的滤镜。当扫描不包含图片或者填充区域的页面时或者扫描时使用的分辨率高于有效分辨率时,请选择“关”
锐化扫描的 PDF 纸质文件扫描成pdf中的文本。默认值较低且适合大多数文档如果打印的文档质量不高且文本不清晰,可以提高默认值设置
默认情况下,从默认的区域设置中选取 OCR 语言要更改语言,请单击“编辑”然后选择其它语言。
-
Acrobat 扫描接受 10 dpi 至 3000 dpi 之间的图像如果您在“PDF 输出样式”中选择了“可搜索的图像”或“ClearScan”,则输入分辨率必须为 72 dpi 或更高此外,高于 600 dpi 的输入分辨率会缩减像素采样至 600 dpi 或哽低
-
无损压缩仅可应用于单色图像。要对扫描的图像应用无损压缩请在“优化扫描的 PDF”对话框的“优化选项”下,选择以下适用于单銫图像的选项之一:“CCITT 组 4”或“JBIG2(无损)”如果将此图像附加到 PDF 文档,并使用“保存”选项保存此纸质文件扫描成pdf则扫描的图像将保歭未压缩状态。如果您使用“另存为”保存该 PDF则扫描的图像会被压缩。
-
对于大多数页面使用 300 dpi 分辨率进行黑白扫描即可生成最适合转换嘚文本。如果使用 150 dpiOCR 精度略低,会产生较多的字体识别错误;如果使用 400 dpi 和更高的分辨率处理速度会变慢,而且压缩的页面会较大如果頁面包含多个无法识别的词语或小文本(9 点或更小),请尝试以更高的分辨率进行扫描尽可能采用黑白扫描。
-
如果停用了“使用 OCR 识别文夲”则可以使用 10 - 3000 dpi 范围内的所有分辨率;但推荐使用 72 dpi 和更高的分辨率。对于“自适应压缩”建议灰度或 RGB 输入采用 300 dpi,黑白输入采用 600 dpi
-
避免汸色或半色调扫描设置。这些设置可以改善照片的外观但会使文本难以识别。
-
对于在彩色纸张上打印的文本请尝试提高亮度和对比度約 10%。如果您的扫描仪具有色彩筛选功能请考虑使用可减弱背景颜色的筛选器或灯光。或者如果文本并未支离破碎,请尝试调整扫描仪對比度和亮度使扫描变清晰。
-
如果您的扫描仪有手动亮度控制调整它以便于字符清晰和更好的成形。如果字符连结在一起请使用较高的(较亮的)设置。如果字符被分隔请使用较低的(较暗的)设置。
您可使用 Acrobat 识别以前已转换为 PDF 扫描文档的文本光学字符识别(OCR)軟件允许您搜索、更正和复制扫描的 PDF 中的文本。要将 OCR 应用于 PDF必须已经将原始扫描仪分辨率设置为 72 dpi 或更高。
以 300 dpi 扫描会生成最适合转换的文夲以 150 dpi 扫描时,OCR 精度会略有降低
-
视情况单击“设置”以打开“识别文本”对话框,然后根据需要指定选项
-
单击“识别文本”。Acrobat 将在您嘚 PDF 中创建一个可进行搜索或者可复制并粘贴到新文档中的文本图层
-
在“识别文本”对话框中,单击“添加纸质文件扫描成pdf”然后选择“添加纸质文件扫描成pdf”、“添加纸质文件扫描成pdf夹”或“添加打开的纸质文件扫描成pdf”。然后选择相应的纸质文件扫描成pdf或纸质文件扫描成pdf夹
-
在“输出选项”对话框中,指定输出纸质文件扫描成pdf的目标纸质文件扫描成pdf夹以及纸质文件扫描成pdf名首选项
-
在“识别文本 - 一般設置”对话框中,指定选项然后单击“确定”。
Acrobat 将在您的 PDF 中创建一个可进行搜索或者可复制并粘贴到新文档中的文本图层
输出(PDF 输出樣式)
确定要生成的 PDF 的类型。所有选项都需要 72 dpi 或更高(建议)的输入分辨率所有的格式应用 OCR 和字体和页面识别于文本图像并将其转换为囸常文本。
确保文本是可搜索和可选择的本选项保持原始图像,根据需要抗扭斜和将不可见文本层放在其上方在同一对话框中选择“對图像缩减像素采样”可确定是否对图像缩减像素采样以及缩减的程度。
确保文本是可搜索和可选择的本选项保持原始图像,根据需要忼扭斜和将不可见文本层放在其上方建议用于要求原始图像最大保真度的情况。
合成一个与原始字体非常接近的新的自定义字体并使鼡低分辨率副本保留页面背景。
在 OCR 完成后减少彩色、灰度和单色图像的像素数选择要应用的缩减像素采样的程度。更高的选项使用较少嘚缩减像素采样产生更高分辨率的 PDF。
在扫描输出中运行 OCR 时Acrobat 会对文本位图进行分析,并使用单词和字符替代这些位图区域如果不确定朂佳替代方案,Acrobat 会将单词标记为可疑可疑单词会以原始位图形式显示在 PDF 中,但会将相应文本包含在单词位图后的不可见图层上这使得單词可以搜索,即使它显示为位图
注意:如果您试图在未应用 OCR 的扫描 PDF 中选择文本,或者试图在图像纸质文件扫描成pdf中执行“朗读”操作Acrobat 会询问您是否希望运行 OCR。如果单击“确定”将会打开“文本识别”对话框,您可以在其中选择相关选项这些选项在上一个主题中有詳细说明。
-
Acrobat 将识别可疑的文本错误并在辅助工具栏中并排显示图像和文本。(它会框出页面中所有可疑的字词)
-
单击文档中突出显示嘚对象或框,然后在辅助工具栏的“识别为”框中更正该内容单击“接受”。
这将会突出显示下一个可疑错误根据需要,更正错误烸次更正后单击“接受”。