在法律、医学、科技等专业翻译领域,术语的规范性与一致性直接影响译文的准确性与专业性。然而实际翻译中,术语对齐常面临提取效率低、译文质量不稳定、缺乏可复核术语表等难题。传统方法如Python + Google Translate虽能提供初步自动化支持,但在专业语境中的表现仍然有限。近年来,得益于自然语言处理工具与大语言模型技术的发展,译者不仅能高效构建术语对照表,也能有效提升术语翻译的准确性。本文基于Python 与LLM 技术,以真实英文股权买卖合同为例进行应用演示。
01
术语输入处理
在进行以下步骤前,可先将合同保存至桌面(命名为:合同.docx),方便后续术语读取:
安装python—docx库用以读取桌面的合同文档: 安装spaCy库,以及en_core_web_sm模型。该模型具备词性标注(POS tagging)、依存句法分析(dependency parsing)和命名实体识别(NER)等基础语言处理能力,能够对输入文本进行结构化分析。【如果需要对术语进行聚类或是语义匹配可以使用en_core_web_lg模型】展开剩余81% 进行术语提取,将代码复制到文本编辑器中,保存一个py格式的文件,用于后续翻译:【注意此处文件保存格式,不然会影响后续的术语提取】
【成功后会得到这样的Excel文件】
02
术语翻译与标注
获得初步术语列表后,核心挑战在于获得准确、专业的翻译。此处采用了硅基流动平台上的DeepSeek-R1-Qwen3模型的API进行术语翻译:
【获得API与代码后,就可以通过AI生成翻译代码,并输入明确的prompt,例如“请将以下英文法律术语翻译成规范、准确的中文法律术语”,为LLM提供翻译风格,提高翻译准确性。代码生成好之后,替换到刚刚保存的extract_translate.py文件中,再在终端里运行python3 /Users/(根据所用电脑路径填写)/Desktop/translate_terms.py这个代码】
此处需要关注的是,填写API时要注意格式是否正确,“< sk- >”是错误的代码,要确保前后没有符号(“sk-”)才能够顺利运行(大部分翻译执行失败都是因为API的问题)。接下来输入运行指令,就可以生成对应的术语对照表:
03
术语输出与校对
与传统的MT翻译相比,LLM在翻译准确性方面有显著提高。例如,LLM可以将“closing date”准确译为“交割日期”,而Google translate则将其译为 “截止日期”;“Exchange Act” LLM译为《证券交易法》,Google translate译为《交换法》
(此处为Google translate翻译结果)
此外,考虑到术语表后续使用,可以添加“审校状态”“审校备注”等列,方便修改。校订完后的术语表还可以导入到Trados Studio,memoQ中,提升翻译的效率和一致性。
相较于机器翻译而言,大语言模型在上下文理解、多义词以及专业术语适应等方面都有较大优势,能有效避免术语“字面直译”的常见问题。与此同时,结合不同文本的指示词,这种模式能够更好地实现翻译结果形式的统一性,有一定的可复用价值与扩展空间。但是由于法律术语的特殊性,LLM的翻译无法完全替代人工校对,不过能够在很大程度上节省译者查找整理术语的时间。
发布于:山西省东南配资-杠杆炒股配资-怎么办理加杠杆炒股-本地股票配资公司提示:文章来自网络,不代表本站观点。