Google Books – războiul continuă

Google Books SearchDupă cum a promis Porumbelul mai demult, prezentul articol îl dedic lui Google Books Search precum şi luptei dintre Google şi autorii/editorii de cărţi.

Google Books, cunoscut anterior şi sub numele de Google Book Search sau Google Print (prima denumire folosită în momentul lansării acestuia la Frankfurt – Germania în 2004), este un serviciul Google care permite efectuarea de căutări prin textele integrale ale cărţilor scanate de Google, convertind textul acestora prin tehnologia OCR» şi salvându-le într-o arhivă digitală. Folosind o combinaţie de limitări ale accesului şi măsuri de securitate (dintre care unele bazate şi pe urmărirea activităţii utilizatorului), Google permite vizualizarea doar a unui număr restrâns de pagini şi încearcă să prevină printarea acestora sau copierea textelor care se bucură de protecţia oferită de către drepturile de autor. Materialele care sunt publice pot fi descărcate şi salvate în format pdf» La 9 octombrie 2009 Google a anunţat că a scanat deja peste 10 milioane de cărţi (cu nişte costuri estimate de aproximativ 50 milioane dolari SUA), dintre care 1 milion sunt vizibile în întregime, în timp ce alt milion ţin de domeniul public. Majoritatea acestora nu mai pot fi cumpărate în formatul tradiţional, pe hârtie, fiind accesibile doar în biblioteci publice.

Majoritatea cărţilor sunt scanate folosind camera Elphel 323 la un ritm de 1.ooo pagini pe oră. Iniţiativa a fost considerată de mulţi salutară, fiind perfect aliniată scopului principal al existenţei Google (acela de a indexa şi pune la dispoziţie în mod gratuit toată informaţia existentă pe mapamond), având potenţial să devină cea mai mare culegere a cunoştinţelor umane. În acelaşi timp o adevărată mişcare constituită din autorii de cărţi şi edituri s-a născut împotriva Google Books din pricina potenţialelor încălcări ale drepturilor de autor/copyright.

Microsoft a început un proiect similar numit Live Search Books spre sfârşitul anului 2006, fiind abandonat în mai 2008 şi accesibil în prezent doar prin intermediul Internet Archive»

Industria publicaţiilor şi asociaţiile scriitorilor au criticat proiectul din start, inclusiv şi scanarea doar a unor fragmente din operele lor literare, pe motiv că Google nu are nici un drept să scaneze şi să stocheze în bazele de date proprii texte care se află sub incidenţa drepturilor de autor. Au urmat o serie de procese împotriva lui Google pe tema asta în America, Germania, Franţa, China, unele câştigate de către autori (care au încasat astfel şi nişte sume de bani de la Google) în timp ce altele s-au stins prin încheierea de înţelegeri.

O înţelegere importantă a fost finalizată în 28 octombrie 2008 între Ghilda Autorilor» şi Google prin care cel din urmă este de acord să plătească suma de 125 milioane dolari SUA către autorii cărţilor scanate şi crearea Books Rights Registry» Ca parte a contractului de 125 milioane dolari SUA, Google a lansat în 11 februarie un site (Google Book Search Settlement) care permite autorilor şi deţinătorilor de copyright să ceară despăgubiri (60 dolari pentru o carte întreagă şi 5/15 dolari pentru fragmente din aceasta). În schimb, Google va putea să indexeze aceste cărţi, afişând fragmente din acestea în rezultatele căutărilor şi să ofere o previzualizare de până la 20% din conţinutul integral al cărţii. De asemenea, Google va putea să afişeze banere publicitare pe aceste pagini şi să vândă versiuni digitale ale fiecărei cărţi. Autorii şi posesorii de copyright vor primi 63% din veniturile generate de exploatarea Google a conţinutului lor (vinderea cărţilor, afişarea de reclame publicitare etc.)

Înţelegerea a intrat în vizorul DoJ (Department of Justice) pe motivul (care altul?) că ar încălca legile antimonopol, rezultatul investigaţiei nefiind încă finalizat. Unul din argumentele interesante folosite de către Google este că scanarea cărţilor va prezerva moştenirea culturală mondială, în octombrie 2009 Sergey Brin făcând următoarea afirmaţie:

“Faimoasa Bibliotecă din Alexandria a ars de trei ori, în 48 î.e.n., 273 e.n. şi 640 e.n., la fel şi Librăria Congresului American care a fost distrusă în proporţie de 2 treimi de un foc în 1851″.

Intenţie nobilă, ce să zic, dar nu cred că Google pierde la această afacere. Doar drumul spre iad e pavat cu bune intenţii, nu?

Share on Facebook
Share on LinkedIn

Optical Character Recognition – procedeul mecanic sau electronic de translatare a textului tipărit sau scris de mână în informaţie digitală editabilă. Este folosit pentru a converti cărţi tipărite pe hârtie  în fişierele digitale şi se realizează de regulă cu ajutorul unui scannerPowered by Hackadelic Sliding Notes 1.6.5
Portable Document Format – format dezvoltat de către Adobe Systems în 1993 cu scopul de a facilita transferarea documentelor. PDF e folosit pentru reprezentarea bi-dimensională a documentelor într-o manieră indepedentă de aplicaţia software, hardware sau sistemul de operare. Fiecare fişier PDF încapsulează o descriere completă a aspectului documentului, incluzând textul, fonturile, imaginile şi vectori grafici 2D, deşi recent este posibilă introducerea de imagini 3DPowered by Hackadelic Sliding Notes 1.6.5
arhivă digitală non-profit fondată de Brewster Kahle în 1996 sub sloganul “acces universal la toate cunoştinţele” (sună cunoscut???). Oferă stocare şi acces către un număr impresionant de colecţii conţinând materiale digitale (inclusiv site-uri web, muzică, clipuri video şi cărţi). The Internet Archive este pe locul doi după Google Books într-un clasament al numărului de cărţi scanate cu aproximativ 1 milion de bucăţiPowered by Hackadelic Sliding Notes 1.6.5
organizaţie americană a autorilor publicaţi cu peste 8.000 membriPowered by Hackadelic Sliding Notes 1.6.5
entitate care urmează să fie fondată fiind sponzorizată iniţial de către Google cu suma de 34,5 milioane dolari sUA şi va funcţiona sub forma unei organizaţii non-profit care va colecta profitul generat de către utilizatorii terţi ai cărţilor (de exemplu Google Book Search), distribuindu-l către autori, editori şi titulari de copyright.Powered by Hackadelic Sliding Notes 1.6.5

Publicat în: Analize

Etichete:

Despre autor: Deși pare uneori cam supărat pe viață, de obicei se abține de la critici gratuite, preferând să publice cu preponderenţă analize obiective ale diverselor trenduri din IT. Cu toate că este o fire destul de agitată, totuși nu prea deschide gura decât când știe exact ce vorbește. După cum se poate vedea și din gravatarul lui, nu mai are toate țiglele pe casă... Umblă vorba prin sat că Şopârloiul şi TransMix ar fi una şi aceeaşi persoană.

RSSComentarii (0)

URL trackback

Comentează




Dacă vrei să apară o poză la comentariul tău, fă-ți rost de un Gravatar.