-
期刊數字化加工介紹
隨著全國文化信息資源共享工程與中國數字圖書館工程的起動,信息化已成為國際潮流,信息資源建設成為當務之急。信息資源建設的重點是電子文獻、各類數據庫、網絡資源、電子雜志、電子圖書等新型數字化信息資源的建設。在數字化信息資源建設中,很大的一個需求是將現有的紙介質印刷品數字化,使之成為能夠用計算機閱讀、理解、查詢、檢索的電子文件,最終將其應用于數據庫存儲,或通過CD-ROM、Internet網進行出版,或上傳數字圖書館供用戶使用。
以傳統紙張為載體的保存方式,占據了大量的空間,需要特殊的環境,而且不方便查詢,隨著時間的推移,還面臨著腐蝕、老化等問題。而將紙介質文件信息進行電子化處理,保存到光盤上,具有存儲、管理、共享等功能,還可以減少文件庫房占地,節省保管設備和人員方面開支,又方便統計和進行遠程查詢。
因此,將圖書、期刊、報紙、文檔資料等信息資源通過掃描儀,掃描成圖像文件,再通過OCR識別成文字,建立目錄和全文索引,制作成電子文件,然后用軟件進行管理使用,已是當務之急。
豆海資料數字化解決方案,擬在以豆海人多年來在圖書、報紙、期刊、雜志和檔案方面的專業的數字化銷售、服務、實施經驗,幫助用戶建立自己的數字化流水線加工工廠,高效、高質量的實現電子資料的加工,或者利用豆海的加工工廠為客戶提供數字化加工服務。
-
期刊掃描加工
數字化正在取代紙質本,成為學術期刊傳播的主要甚至是唯一渠道。
大型期刊數據庫給學術傳播帶來的最大變化是讀者(學者)閱讀學術文獻的習慣發生了徹底改變:由讀紙本的期刊變為讀數據庫。 ?
這一變化給以傳統紙本期刊的影響是致命的:社科期刊這一獨立存在的個體已迷失在網絡的海洋之中。從傳播效果看,讀者樂意為這樣的數據庫而改變自己的閱讀方式。
隨著期刊數據庫的風行,期刊紙本的發行量直線下降,且無可挽回。
-
與數字化傳播相對應,數字化的期刊體系應該具備下列特征:
1)更為開放的公共學術平臺。
2)大量學術信息的聚合。
3)學科或問題邊界清晰、更加靈活組合的個性化多樣性形式。
-
期刊數字化加工流程
1.圖像掃描:
按照客戶要對期刊進行掃描。采用高速掃描儀或零邊距平板掃描儀進行掃描,生成TIFF、JPG、PDF等圖像文件。
2.圖像處理:
對掃描后的圖像進行處理,包括去黑邊、糾偏、去污漬、版心居中、二值化等,有利于提高文字的識別率。
3.文字識別:
豆海采用國際領先的OCR識別技術,既可以識別常見的簡體漢字、繁體漢字、英文,也可以識別日文、韓文、俄文、德文、法文等190多種文字,準確率99.5%以上。
4.格式轉換:
格式轉換是將其他格式的文件轉換為雙層PDF。文件格式可以是電子文檔,如DOC、S2、S72、PS、WPS等多種文件格式;也可以是經過整理順序模塊整理成冊的紙張掃描文件。
5.資源加工:
對文檔的元數據進行標引;制作文檔目錄;在PDF中制作文檔內鏈接;對元數據標引、分類、目錄制作等。
6.數據提交:
將制作好的數據安全提交給客戶,可刻錄光盤,掛接網絡等。