频道栏目

华西新闻  >  创业谈  >  正文

硬科技创业 | 阴差阳错干翻译,竟创出全球第二大语料数据库

2019-09-18 16:50:30   来源: 天虎科技
0

非常高,于是花了一些时间做研究,凭借着大学时因兴趣爱好学习的编程技术,统计文件中的重复段落,马帅花三天时间,自动提取、拆分并重构了待翻译的文本。


除了把翻译任务分发给公司员工,马帅又找来200多位兼职翻译,以及数十个负责排版、打印、装订的兼职大学生。最高峰时,竟同时有300多人在为这个翻译项目忙活。拼尽全力,马帅的团队终于在交付节点前一个小时,将翻译任务全数完成。


功夫不负有心人,项目成功得到土库曼方总工程师的验收和褒奖。经此一役,马帅的翻译公司一炮而红,在石油系统内打响了名气,业务纷至沓来。原本就相信技术能提高翻译效率的马帅,尝到了甜头,更加坚定了想法,而另一个契机,则让他走上了机器翻译的道路。


沉淀数据数年,“三剑客”集结打造云译通


某次行业会议,马帅发现同行正在翻译一份新发布的汽车技术标准,而自己的公司刚刚才将这份标准翻译好。马帅敏锐地注意到,在整个翻译市场,存在大量重复性劳动。如果像中石油的项目一样,把以前处理过的翻译内容整理成海量数据库,再有新任务时,参考历史数据完成新文件的翻译,会不会对提升行业效率和降低成本有帮助呢?


于是自2011年,马帅开始有意识地收集翻译数据。彼时中国存有超过7万家翻译公司,日常活跃的有5000家,马帅跟其中2000家有过交流。这2000家翻译公司,术业有专攻,有精于中英互译、中日互译、中德互译的,有精于机械领域、电子领域、通信领域、能源领域、医疗领域的,不一而足,马帅只取其翻译得最好的部分,或合作或购买,逐渐积累了一批庞大的翻译语料数据,并在圈子内发起共享。


这一举动,为后来译讯科技训练人工智能翻译埋下了伏笔。为了提

  1. 上一页
  2. 1
  3. 2
  4. 3
  5. 4
  6. 5
  7. 6
  8. 7
  9. 下一页

我要爆料(有奖爆料:20元--1000元)我要爆料 网络爆料台 随时随地,极速爆料

虚假新闻邮箱爆料:130069110@qq.com

虚假新闻举报电话:028-86969039

电话爆料:028-96111

邮箱爆料:130069110@qq.com

微信关注 天虎科技

天虎科技

聚焦科技深度报道和创投连接
微信号:tianhukeji

虎探小程序

封面新闻华西都市报官方微博

华西都市报电子版 点击阅读

华西都市报电子版

返回顶部