此处与“可编辑Illustrator文件导出”一节中“分割文件”部分相同。
新建一个图层

然后将最底部的图层上锁,如图。

将前景色设置为黑色,背景色设置成无色,如图:

然后,拖动视角至需要提取的文字上,使用左侧工具栏中“矩形工具”(快捷键M),在文字上方覆盖画一个框。如图所示:

为了便于观察,可以选中此框,在“属性”面板中将其透明度设置为50%。

框的大小不要超出文字太多,也不要与文字过于紧贴。
按照这种方式,把每一个需要翻译的文字都打上框。
需要注意的是,框住的部分需是完整的,不能将一个句子框在两个不同的矩形框中。
矩形框可以复制,通常文件之间具有相似性,比如图框的部分文字位置都相同,可以将一个矩形框复制到其他图上。按Ctrl+C剪切,转到其他图,按Ctrl+F粘贴。
使用AdtpWord插件中的Illustrator --> 文档导出 --> 从文件夹导出ai文件,打开选择文件夹窗口,选择刚才项目的文件夹。
在“导出设置”页面中,抓取分辨率设置为300dpi;打开个数根据电脑配置选择,此处选10;导出内容选择仅文本框,点击“确认”按钮。
该窗口其他选项的说明参考上一节“可编辑Illustrator文件导出”
在导出进度完成后,需等待Word写入完成,如图:
在以中文或英文为主的稿件中,可以在提取的Word稿中选中右列,使用工具栏上的“文本识别”,或者使用Illustrator --> 提取稿调整 --> 识别右列来自动识别全文。
但在此教程中,我们使用第三方工具“Abbyy FineReader 15”来识别我们的稿件。
使用“Abbyy”来识别具有一定的优势,首先是“Abbyy”对俄语和拉丁字母形的识别正确率良好,并且不受网络影响,可以在本机运行等。
首先对“Abbyy”进行设置,点击工具--选项--格式设置,红圈处都不要勾,如图:

将此处的语种设置成目标语种:

将导出的Word文件另存为pdf格式,拖入到Abbyy中打开,会自动打开ocr编辑器,使用自带的分析页面和识别页面来识别文档:
正常情况下会将所有内容识别为表格,因为提取稿是左列隐藏的两列表格,所以OCR后的Word,应该是左列空白,右列可编辑文字的两列表格。
识别完成后,需检查一下文档,确保分析页面不会分析错误
例如此处存在识别错误,手动删除识别的框,并用表格工具手动画出表格的正确边界。
小技巧:在Abbyy中可以使用快捷键,点击菜单栏的“查看”-“工具栏”-“自定义”可打开自定义快捷键窗口,在弹出窗口中选择“键盘快捷键”选项卡,可以将下列快捷键设置一下(以下快捷键可自由调整):
此外,还需记住,使用Shift+Alt可以在表格中画一条横线,Shift+Ctrl可以在表格中画一条竖线。
Tips:如果遇到不需要识别的文字,可以选中单元格,点击下方的区域属性,将将选定单元格识别为图片打勾。
通过Abbyy分析完页面后,点击窗口上方的“语种”一栏以设定语种,然后点击“识别”按钮完成识别。
在识别完成后,依然可以重新修改表格结构,只需要在修改完成后,重新在页面列表中“右击”选择识别即可。
等待识别完成后,在上方工具栏选择格式化文本,然后点击左侧保存按钮旁边的小三角,在弹出的菜单中选择另存为Microsoft Word文档。等待导出成功。
通常来说,Word文件大部分结构都是正确的,但某些位置表格任然会出现错位问题,需要检查。AdtpWord插件会自动检查该文档与导出的文档之间表格上的行数差异,并自动定位到相关表格。
打开Adtp载入项,在Illustrator--提取稿调整--导入Abbyy识别后文档,在弹出的窗口中选择刚刚从Abbyy保存的Word文件。插件会自动开始分析,如果遇到表格行数不一致,会自动定位到表格的位置进行提醒。等修改结束后,点击重试即可重新分析。
表格的错误可能有以下几种情况:
| 现象 | 解决方法 |
|---|---|
| 两个表格合并成了一个 | 找到异常合并处,通常为标黄的行(代表文件名),把光标放在标黄的行的左边单元格的开头,按Ctrl+Enter插入分页符。 |
| 本应是一个表格的拆分成了两个表格 | 将两个表格中间的空行删除 |
| 文件名行缺失(或文件名行没有正确识别进表格内) | 在表格前插入一行 |
| 识别后的Word比导出的Word行数少(多) | 这通常是可编辑的文字行在Abbyy中识别到了错误的位置,如果表格上没有断开,可直接在识别后的Word后面新建几行,直到与导出的Word行数相同,或者点击`忽略`按钮忽略此处错误 |
反复根据窗口上的错误信息修改表格,直到两个Word中表格的个数和行数都相同,插件会自动执行导入,将识别后的文字替换至导出的Word的右列中。
这一步是提交译前稿之前的最后一步,将导回的Word进行检查。如果Abbyy设置正确,Word中文字会带有蓝色底色,这代表在识别中不确信的字符,需要重点检查。
将Word最大化,并通过Ctrl+鼠标中键将窗口缩放至合适的大小,有助于快速发现错误。
仔细的检查和快速的熟练度是识别的关键,灵活运用Ctrl+H查找替换可以增加识别的速度。