當前位置:服務 > 報紙掃描加工
-
報紙掃描加工
以傳統紙張為載體的保存方式,占據了大量的空間,需要特殊的環境,而且不方便查詢,隨著時間的推移,還面臨著腐蝕、老化等問題。而將紙介質文件信息進行電子化處理,保存到光盤上,具有存儲、管理、共享等功能,還可以減少文件庫房占地,節省保管設備和人員方面開支,又方便統計和進行遠程查詢。
將報紙進行整理,采用大幅面掃描儀進行數字化加工,然后對圖像進行拼接,形成完整的PDF文檔。作為報刊數據庫,方便用戶在線閱讀、下載和管理。
1. 報紙整理
報紙是重要的文獻,需要妥善分類,按照報紙的紙張情況、版面、裝訂方式等進行妥善分類和整理,并選擇合適的數字化設備。
2.報紙掃描
根據報紙的幅面,選擇A3平板掃描儀等進行數字化加工。對于早期的報紙,可以選用數碼相機進行高精度拍攝,盡可能保持報紙原貌。
3.圖像處理
由于報紙大小不一、排版方式靈活,所以要采用圖像拼接技術,將內容進行完整的銜接。對掃描圖片進行處理,去邊、消除污點、傾斜、版心不正等問題,并統一格式。
4、文字識別:
豆海采用國際領先的OCR識別技術,既可以識別常見的簡體漢字、繁體漢字、英文,也可以識別日文、韓文、俄文、德文、法文等190多種文字,準確率99.5%以上。
5、格式轉換:
格式轉換是將其他格式的文件轉換為雙層PDF。文件格式可以是電子文檔,如DOC、S2、S72、PS、WPS等多種文件格式;也可以是經過整理順序模塊整理成冊的紙張掃描文件。
6.數據標引、掛接。對文章進行分篇、著錄、鏈接,將PDF電子文件掛接到數據庫,實現圖、文一致,為用戶提供良好的檢索軟件。