繁體小說 > 重生之乘風而起 > 第747章 計算機語言

第747章 計算機語言

⬅ 上一章 📋 目錄 ⚠ 報錯 下一章 ➡
⭐ 加入書籤
推薦閱讀: 花都風流第一兵王 代嫁寵妻是替身 天鋒戰神 穿越古代賺錢養娃 我覺醒了神龍血脈 我的老婆國色天香 隱婚嬌妻別想跑 遲遲也歡喜 全職獵人之佔蔔師

  第747章 計算機語言

  “或許還是需要進行人工乾預,但是工作強度已經大大降低,我們可以通過拍照,掃描等方式,將生僻字的圖片掃入計算機,讓程式去分析它,最後得到標準點陣字,編碼之後加入到字庫當中,對字庫進行擴充。”

  “要實現這個功能需要有幾個前提,第一就是字庫當中要有足夠的樣本,這個我們已經已經完成,因為我們現在已經有了四萬個標準點陣字的字稿。”

  “還是拿《康熙字典》來舉例,我們先將《康熙字典》上每一個單字的掃描圖掃入文字識別係統,然後提取其字體參數特征,再將這些參數賦給已有的標準點陣字,讓係統計算出根據這些參數產生的‘係統字’。”

  “再拿這些生成的‘係統字’,與‘掃描字’進行校驗,通過四萬個標準字生成的‘係統字’,去驗證參數的代表性,最後將參數調整到最佳。”

  “得到參數體係之後,我們就能夠將它套在掃描進來的生字上,最終得到《康熙字典》全部近六萬個單字的標準點陣字,字庫就從四萬擴充到六萬了。”

  “這個思路倒是新穎,然而卻也是可行的。”麥明川點頭:“不過還是有問題,就是存儲和運算。”

  “我也拿《康熙字典》來舉例,近六萬個單字,就是近六萬張圖片,我們就拿一張圖片五兆來計算,這就是300G的空間,這也太可怕了。”

  “那王院長覺得,這個係統多大的圖片存儲容量,可以被接受呢?”

  “一個G,”麥明川脫口而出,想了想覺得實在是有點欺負人:“最多最多,兩個G。”

  1G是1024M,兩百張5M的圖片,兩G就是400張。

  “也就是說,如果按照這個標準,這個係統能夠一次同時完成四百個字的掃描分析和成字入庫的工作?”

  “那還得分序列並行。”李紅江已經上套,開始思索程式的工作方式了:“涉及到時間成本,學校也不可能將有限的計算資源全拿來做這事兒。”

  “那我們可不可以像上級求助呢?”周至問道:“我們先把基礎工作做好,然後申請國家級的運算資源來完成它,有冇有機會呢?”

  “國家資源那更緊張,全國無數單位排隊呢。”麥明川苦笑著搖頭。

  辜老說道:“那乾脆這樣,我們將工作再做細一點,肘子說的這個文字識別反向推算點陣字的程式咱們先緩一緩,第一步先集中精力把標準定出來。”

  “與此同時,我們這邊,再把現在的四萬字稿擴到七萬。”

  “小李那邊,抓緊先開發出讀字稿的程式,咱們先把七萬字稿的數字化工作完成。”

  “之後再拿著這七萬漢字的數字化成就,去跟那個統一碼聯盟談判,並且要留夠下一步繼續拓展的空間,力爭讓我們的大字庫成為全球統一標準。”

  “有了這個大字庫,咱們再製定出幾個子集,滿足國內國際不同應用場景的需求。到此我們的第一步工作是不是就算完成了?”

  “至於肘子說的文字識別,那也相當重要。”辜振鐸補充道:“這個可是我們下一步搞典籍數字化的神器啊!”

  辜老不由得歎了一口氣:“這不是資源有限,怕排不上嘛?”

  “那也不一定。”周至說道:“咱們大可以將這些思路都給一股腦兒報上去,咱漫天要價,在等著部委落地還錢,取乎其上,得乎其中嘛!”

  大佬們都鬨笑起來,這肘子是懂部委的,要人家不拿捏你,百分之百滿足你的要求,幾乎都是不可能的,能夠滿足你五成那都是開恩了。

  因此不妨將餅子劃大一點,最後哪怕給砍掉一半,落個小餅子也差不多夠吃。

  今天隻是一個務虛會,算是統合一下思路,研究一下文理跨學科合作的可能性,現在能夠得到一個較為統一的意見,就已經算是超出會議預期了。

  這裏邊主要功勞,還是周至已經完成的前期工作。

  李紅江就握著周至的手,熱切地道:“要不再多修一個資訊工程學位吧?我看肘子伱雖然是文科生,但資訊技術的基礎這麽好,多修個學位一點問題都冇有的。”

  “精力實在是太有限了。”周至隻能婉拒李紅江的好意:“不過那個文字識別係統我是非常有興趣的,李教授要是有興趣,我也可以參與研究。”

  “你對編程熟悉不?BASIC或者PASCAL。”到現在李開江絕不相信周至會是外行。

  “我更熟悉C語言。”周至回憶起當年被代碼支配的恐懼。

  “C?”李紅江感覺自己好像撿到寶了:“那UNIX呢?”

  “UNIX也還行。”周至問道:“學校這是有新引進的小型機了?可以運行ANSI C的那種?”

  對於多數人來說,兩人的對話好比天書。

  計算機語言最基本當然就是直接對晶片操作的指令集,例如最早的打孔紙帶,直接就是零和一的組合。

  這種語言對計算機來說最直接,但是對人來說最不友好。

  於是人們就發明瞭一套基於晶片的“基本指令集”,這就是匯編語言。

  匯編語言同樣還是針對晶片,但是至少可以讓專業人士讀懂這程式是要讓機器乾什麽的了。

  但是匯編語言有個問題,那就是無法移植,因為它是針對某一類晶片開發的,換到另一類晶片上,另一類晶片就看不懂。

  於是人類又想出一種辦法,設計出編譯庫概念和更高一級的程式,這就是麵向過程的編程語言,C語言就是其中的佼佼者。

  C語言很難,原因就在於它具備匯編語言簡潔高效的特征,因此工作迅速,代碼緊湊,可讀性比匯編語言好,最關鍵是容易調試,修改和移植。

  程式員隻負責寫代碼,代碼寫好之後對其進行編譯,就能夠轉化為能讓計算機讀懂的二進製代碼,稱為“應用程式”。

  針對不同的晶片類型,編譯庫中有不同的編譯方式,可以將C語言編寫的程式編譯成能夠在不同係統上運行的程式。

  這就解決了程式的移植問題,讓同一個程式,既可以在DOS係統裏運用,也可以在蘋果係統裏運用,還可以在UNIX係統裏運用,不用分別編寫三套。

  (本章完)

⬅ 上一章 📋 目錄 ⚠ 報錯 下一章 ➡
升級 VIP · 無廣告 + VIP 章節全解鎖
👑 VIP 特權 全站去廣告清爽閱讀 · VIP 章節無限暢讀,月卡僅 $5
報錯獎勵 發現文字亂碼、缺章、內容重複?點上方「章節報錯」回報,審核通過立獲 3天VIP
書單獎勵 前往 個人中心 投稿你的私藏書單,審核通過立獲 7天VIP
⭐ 立即升級 VIP · 月卡僅 $5
還沒有帳號? 免費註冊 | 登入後購買