-
報紙數字化加工介紹:
在數字化信息資源建設中,很大的一個需求是將現有的紙介質印刷品數字化,使之成為能夠用計算機閱讀、理解、查詢、檢索的電子文件,最終將其應用于數據庫存儲,或通過CD-ROM、Internet網進行出版,或上傳數字圖書館供用戶使用。以傳統紙張為載體的保存方式,占據了大量的空間,需要特殊的環境,而且不方便查詢,隨著時間的推移,還面臨著腐蝕、老化等問題。而將紙介質文件信息進行電子化處理,保存到光盤上,具有存儲、管理、共享等功能,還可以減少文件庫房占地,節省保管設備和人員方面開支,又方便統計和進行遠程查詢。因此,將圖書、期刊、報紙、文檔資料等信息資源通過掃描儀,掃描成圖像文件,再通過OCR識別成文字,建立目錄和全文索引,制作成電子文件,然后用軟件進行管理使用,已是當務之急。
中國數字出版進入了快速發展期;目前每年出版電子圖書50萬種以上,并呈大幅增長趨勢。全國現有1937種報紙的大多數報紙開展了數字報業務,單獨出版的數字報有700份以上?,F有期刊網站580多家,電子期總量已經達到近萬種。數字出版使中國報紙、期刊借助互聯網跨出國門,走向世界。
-
報紙、期刊數字化發展有未來趨勢:
1、容服務互動化趨勢
2、字媒體移動化趨勢
3、贏利模式多元化趨勢
豆海人多年來在圖書、報紙、期刊、雜志和檔案方面的專業的數字化銷售、服務、實施經驗,幫助用戶建立自己的數字化流水線加工工廠,高效、高質量的實現電子資料的加工,或者利用豆海的加工工廠為客戶提供數字化加工服務。將報紙進行數字化加工,把文本、圖文等各種文檔生成全文檢索光盤,既可以用于單機版發行,也可以用于網絡供客戶端瀏覽,制作成年度數據光盤、專題資料光盤、數據全集光盤等多種形式。
-
技術特色:
1、際通用的PDF格式。PDF格式是國際通用標準,可以完整地保留原來的版式,精確地顯示原貌,添加書簽、鏈接、批注等;
2、好的文件壓縮壓縮比。采用動態二值化技術,文件體積極大地壓縮,圖像清晰、下載速度快、文字識別率高、占用空間少;
3、層PDF的生成:既然可以對現有的電子文件s2/ps2/ps格式進行轉換,也可以將紙質資料通過掃描和OCR軟件生成。
4、支持多種檢索方式。支持單字段簡單查詢,也能進行多字段多條件模糊檢索、二次檢索、復合檢索,還可以對圖像內容進行全文檢索,檢索結果定位到文檔所在頁面的具體位置,文件內容原版顯示,可自由放大或縮小,大大提高了電子文檔利用深度,為進一步開展電子文檔內容分析、挖掘打下基礎。