我對機械進修沒有偏見－gonzalcvt68m@outlook.com

印度語口譯證照

所以不要誤解天成翻譯公司對機械學習有私見！還誤解天成翻譯公司是本身不懂才故意不消的！真的不是如許！我曾最討厭JavaScript，可是HTML5鼓起後，一年以內我就變成JS的專家，還能講授生用JS寫出類似Line的通信軟體！晚期的學生以為我一向都是寫JS的人！學姊返校跟天成翻譯公司創業時卻很驚奇：「教員你不是一貫喜好用VB，很討厭JS的嗎？怎麼學弟們最闇練的語言是JS，而不是VB了？」以此觀之，我是對峙抗拒新科技的老固執嗎？你們自己判斷吧！

良多人會懷疑：「翻譯公司根本不消機器進修的技術，做那麼多影象辨識的工作不會受到限制嗎？會不會許多事做不好？做不快？或做不出來啊？」就像某位老闆竟然沒有手機？這不會影響經商嗎？其實目前對我來講是不會的，原因且聽我道來！

固然這些跟我的工作算是無關的，即使是辨識藥盒上的字串，他們也不是要我「翻譯全文」只是要抓出批號與過時日，天成翻譯公司的大麻煩並非「字很新鮮」而是字的位置局限欠好確定，必需有一個程式在任何色彩、字元巨細與印刷體式格局下，即便字元沾連或破裂天成翻譯公司都能准確圈出那些字來辨識，因為字的可能性不會太多，我不會用OCR，不然買授權就是我本身工作報價的很多多少倍了！

所以我做的工作很像二廚替大廚準備食材，就是影像處置需要的準備步調，灰階化→二值化→輪廓化→切割為自力字元方針翻譯簡單嗎？很難的！因為狀態非常多，如前面的圖形吧？點矩陣列表機印的文字，在影像上根本就是分手的方針，若何「融合」它們成為一個單一目標送給OCR辨識就是個很難處理的邏輯。相對的，印刷字太擠，影象相連沾在一路時，兩個字被看成一個字送去辨識，OCR固然沒這麼伶俐，怎麼比對謎底都是錯的！此時我就必需「切臘腸」，准確切開相連目標之後才能餵給OCR。

天成翻譯公司今朝的工作可以算是OCR(Optical Character Recognition，光學字元辨識)，就是讓影像中的文字釀成真正可以在電腦中被識別編纂的文字資料，車牌辨識其實就是其中一個最廣用的案例！我以研究車牌為起點，不測地受到業界正視，入手下手協助許多範疇去影象中「找字元」！掃描文件是在2D的根蒂根基上做，拍攝的照片則是在3D的根本上處置，前者已不簡單了，後者變數就更多！

若是OCR或機械進修軟體完全沒有字元在哪裡的出發點資訊，那就必需在原圖上逐點掃描，乃至也不知道目標大小，一個字模上是10x20的字型，在原始影像上多是任何寬高比1:2的圖形，加上會傾斜乃至變形！OCR或機器學習軟體即便能跑出准確成效，所需時間也會慢到讓人無法接受的！OCR自己固然有「基本」的字元鎖定程式，然則能力有限，碰著印刷複雜或不是極清楚的影象就很容易辨識失敗。

所謂機器「進修」就隱含了測驗考試毛病的意義，感覺上OCR資料庫是死的，機械進修多了一些想像的空間，好像他會積累經驗？或最少比定型資料比對更有彈性！可是列位可想到運算時間的問題？OCR軟體目前很貴，首要緣由就是它可以極度快速的從十分多的可能字元中比對出了局，它的價值是「快」不是伶俐！所以這些年它不但沒有被機械進修軟體代替，還繼續保持很貴！

我「暫時」不消機械進修的緣由也差不多！用機械進修機制來辨識字元，對我目前的需求來講沒必要。至於用機械進修幫我判斷字元外形位置？判斷目的是不是需要融會或切割呢？這是抽象思慮，AI今朝還沒這麼伶俐啦！假如罷休讓他們「自我學習」可能會算到天荒地老！利用軟體的客戶鐵定會抓狂的！請記得：機器進修的弱點是需要良多計較，你的手機或PC效能可以跟Alphago比擬嗎？

事實上機械學習的強項是和OCR軟體類似的！首要用於「認知」誰人圖案是甚麼意義！今朝天成翻譯公司除做車牌辨識以外，最大項的工作就是替以OCR為根蒂根基，推出影象辨識軟硬體商品的公司辦事。他們需要我幫手的當然不是如何辨識奇奇怪怪的字，而是處置從原始影象中准確抓出字元區塊的這個步調！

OCR包羅兩個主要階段，先是要在影象中鎖定正確的字元位置，其次才是根據鎖定的目標區塊最先翻箱倒櫃，用資料庫中的資料比對出那是甚麼字(或圖案)翻譯那些翻箱倒櫃辨識奇形異狀文字的工作目前的OCR軟體已做得很好，是個和功課系統一樣成熟複雜的商品，所以這部分基本沒我的事！車牌辨識因為只需辨識少數的字元與字型，這部分我就簡單自己做了，沒必要買OCR軟體，若是買了就賠死了！

天成翻譯公司提了一下準備做藥盒辨識的議題，良多機械學習或深度學習的建議又來了！明顯在這個 AI 的新時期，機械進修釀成顯學了！事實上天成翻譯公司對此也是略知一二的，但實際操作的技術上確切是沒經驗，但天成翻譯公司估量研發的時候與取得足夠樣本或資料庫的本錢較高，讓我不會將機械進修當作最好的選項，乃至我判斷較適合用這類體例解決的案子，就直接辭讓或推薦他人做了！

本文出自: http://blog.udn.com/yccsonar/105937889有關各國語文翻譯公證的問題歡迎諮詢天成翻譯公司02-77260931