日韩欧美视频一区-日韩欧美三区-日韩欧美群交P内射捆绑-日韩欧美精品有码在线播放免费-成人免费一区二区无码视频-成人免费一级毛片在线播放视频

SCI期刊 | 網站地圖 周一至周日 8:00-22:30
你的位置:首頁 >  圖書檔案 ? 正文

古騰堡計劃電子圖書的校對方法

2021-4-9 | 圖書檔案

 

1引言

 

“古騰堡計劃”是全球最具影響力的免費電子書網站之一。它由美國的邁克爾•哈特(MichaelHart)創建于1971年。經過多年的發展,它已擁有超過38000種精校圖書向全球讀者提供免費服務,既可以在線閱讀,也可以下載mobi、epub等格式的文件在亞馬遜、蘋果等廠商生產的移動設備上閱讀。2012年2月,其Alexa全球排名已進入前5000位。“古騰堡計劃”采用了分布式建設的模式,其圖書大多由來自世界各地的眾多志愿者進行加工。由于志愿者在能力、素質以及工作熱情等方面存在著諸多差異,為保證古騰堡圖書的質量,加強校對的精度顯得日益重要。在這個背景下,2000年,CharlesFranks建立了“分布式校對”系統,以支持“古騰堡計劃”圖書的數字化文本建設。最初,這個“分布式校對”系統從屬于“古騰堡計劃”。2002年,它有了自己的官方網站。2006年,它成為單獨的法人實體,但依然與“古騰堡計劃”有著密切的聯系,由這個系統產生的電子書,是“古騰堡計劃”圖書最重要的來源[1]。

 

2“古騰堡計劃”電子圖書制作流程

 

“古騰堡計劃”的電子圖書之所以受到廣泛歡迎,是因為它既是免費的,又是高質量的。它的圖書制作遵循著一個非常嚴格的流程:(1)使用在線的軟件和數據庫創建圖書館。(2)世界各地的內容提供者將圖書掃描,并將掃描件上傳到圖書館。“古騰堡計劃”根據美國版權法對電子書進行版權驗證,只有版權過期者才可以添加到計劃的列表中。(3)參與校對的志愿者選擇一本圖書進行校對。(4)這時候,網站會顯示給校對者一個網頁,內容包括掃描文件和通過文字識別軟件產生的文本文件,校對者通過兩者的比對進行校對。這極大地減少了校對者的工作量。(5)除了修正文字識別軟件所產生的文本中的錯誤,校對者還需標注原著中的粗體、斜體字以及腳注等內容。(6)校對是協作式的,來自世界各地的志愿者通過互聯網可能對同一本書的不同頁進行校對。校對者在完成了對某本圖書一頁的校對后,可以再申請新的校對頁,也可以退出校對。有意思的是,“古騰堡計劃”并不鼓勵校對者一天校對太多的頁數,他們的建議是“一天一頁”。他們認為,每個人每天對校對工作貢獻的綿薄之力,最終會形成生產數字圖書的強大力量。2004年,“古騰堡計劃”的管理者自豪地宣布:平均每天有300~400個志愿者參與校對工作,平均每天完成校對頁數4000~7000個,這意味著每分鐘完成校對4個圖書頁。實際上,2004年以后,志愿者數量和校對頁數總量等數據每年都有相當大的增長[2]。(7)校對過的圖書頁會保存在網站的數據庫中,等待下一輪的校對。“古騰堡計劃”的校對會有2輪,以盡量避免錯誤的發生。(8)當所有的圖書頁都經過2輪校對后,“古騰堡計劃”的處理軟件會將其整合成一本完整的數字圖書,并且再進行一次錯誤檢查。由于一本書的校對很可能是由多人完成,因此這時的重點在于一致性的檢查上。(9)通過檢查后的圖書會被歸檔,并上傳到全球各地的鏡像站點,向全世界提供免費閱讀和下載[3]。可以看出,“古騰堡計劃”的數字圖書制作,奉行“質量優先”的原則。雖然它的圖書數量并不太多,但涵蓋了莎士比亞、列夫•托爾斯泰、馬克•吐溫等著名作家的經典作品,另外也包含了許多非文學類的名家名作,而且這些都是相對可靠的電子文本,為世界各地的讀者進行閱讀、欣賞和研究提供了極大的便利。

 

3分布式校對的幾個關鍵環節

 

3.1分布式校對與集中化管理

 

“古騰堡計劃”的圖書校對和制作雖然是由各地的志愿者采用分布式的方法完成的,但其基礎卻是集中化管理。在版權認定、決定哪些圖書可以進行掃描、校對與提交以及圖書的整合、發布等方面,都不是由志愿者自由和隨意地進行,而是由“古騰堡計劃”的核心小組統一安排。“古騰堡計劃”的管理者會在廣泛搜羅圖書的基礎上對未加工的圖書進行審查和鑒定。作為非贏利性組織,“古騰堡計劃”準備加工圖書的來源非常龐雜,很多圖書來自圖書拍賣會、圖書館的剔舊以及各類捐贈。志愿者會將這些圖書的封面、封底和版權頁掃描,送交“古騰堡計劃”的版權小組進行審查。版權小組由熟悉知識產權領域法規的專家組成。只有通過審查的圖書,才會被允許進行數字化加工。這一舉措,有效地避免了可能出現的知識產權糾紛。一旦通過了版權審查,相應的紙質圖書會被送交個別志愿者,他們將書脊拆散后掃描,在得到掃描圖像的同時,用文字識別軟件產生與圖像文件對應的文本,然后將這些文件上傳到服務器。這一工作過程也是相對集中的,僅由少數較為可靠的志愿者完成,這樣可以保證掃描與文字識別的精度。上傳到服務器的文件進入“分布式校對”系統,發布在互聯網上。這時來自世界各地的眾多志愿者就可以利用該系統進行分布式校對。在所有的工作環節中,項目管理員(ProjectManager)、后期制作員(PostProcessor)發揮著重要作用。項目管理員負責監控數字圖書的制作過程,后期制作員負責在校對完成后整本圖書的整合工作,包括確定圖書的題名是否正確、圖書結構是否完整、是否有缺頁等[4]。可以看到,“分布式校對”系統的設計針對的是在電子書制作中工作量最大的校對環節,它運用Web2.0的思維,利用眾多志愿者的合力突破了圖書數字化工作中的瓶頸。同時,在電子圖書的制作過程中堅持嚴格的質量控制,在目標確認、工作流程制定、質量監測、圖書發布等環節均由專家進行集中化管理,遵循嚴謹的規范。

 

3.2校次的管理

 

為了防止疏漏和失誤,“古騰堡計劃”電子圖書的分布式校對并非一次成型,而是堅持多次交叉校對。他們把不同階段的校對文本分為“銅文本”(Bronzee-texts)、“銀文本”(Silvere-texts)和“金文本”(Golde-texts),這與中國古代校讎的“三校”制有異曲同工之妙[5]。“銅文本”指那些處于最初校對階段的文本,任何注冊后的志愿者都可以在上面展開工作,主要任務是清除用軟件進行文字識別所產生的錯誤。新加入的志愿者只能從事這一階段的工作,整本圖書的后期加工與合成則由富有經驗的資深志愿者完成。“銀文本”指那些已經經過校對并按照規定的編排格式整合成型、處于后期加工階段的圖書,這一階段的主要任務是進行一系列準確性和一致性的檢查。“金文本”指那些完成了一系列校對、格式編排、后期加工等程序,提交到古騰堡網站供讀者下載使用的圖書。當然,這類圖書的文本也并非不可更改。考慮到數字圖書生產的復雜性,各個環節的工作稍有疏忽都可能造成錯誤,“古騰堡計劃”建立起了強大的報錯機制。志愿者和普通讀者都可以向古騰堡的管理者報告其正式發布的圖書中的錯誤。對于報錯,“古騰堡計劃”也有一套自己的流程和標準,例如對目錄錯誤和文本錯誤的報告區別對待,對如何報告缺字、排印錯誤等,都有具體的要求[6]。嚴格的校次管理,保證了數字圖書的質量。強大的報錯機制,使得“古騰堡計劃”的圖書始終處于不斷自我完善的過程之中。

Top
主站蜘蛛池模板: 我的家庭女教师 | 久草在线新是免费视频 | 国产精品成久久久久三级四虎 | 美女被打开了屁股进去的视频 | 日本美女靠逼 | 受被攻做到腿发颤高h文 | 18国产精品白浆在线观看免费 | 欧美日韩国产在线一区二区 | 18禁黄久久久AAA片 | 一级毛片视频免费 | 伊人久久综合影院 | 午夜福利体检 | 精品夜夜澡人妻无码AV蜜桃 | 365电影成人亚洲网在线观看 | 国产精品97久久AV色婷婷综合 | 亚洲国产无线码在线观看 | 日韩爽爽影院在线播放 | 蜜桃TV成人网站免费打开 | 99影视久久电影网久久看影院 | 全部免费特黄特色大片看片 | 一本大道手机在线看 | 2020年国产精品午夜福利在线观看 | 91嫩草私人成人亚洲影院 | wankz tv videos国产| 国产电影一区二区三区 | 亚洲人成伊人成综合网久久久 | AV天堂午夜精品一区 | 嫩草影院未满十八岁禁止入内 | 影音先锋电影资源av | 贵妃高h荡肉呻吟np杨玉环 | 欧美丰满少妇久久无码精品 | 亚洲高清一区二区三区电影 | 99久久香蕉国产线看观看 | 美女禁处受辱漫画 | 日本一卡2卡3卡四卡精品网站 | 教室里的激情电影 | 麻豆精品无码久久久久久久久 | 久久只精品99品免费久 | 97影院理论午夜伦不卡偷 | 又大又硬又爽免费视频 | 国产伦子沙发午休系列资源曝光 |