niedziela, czerwca 20, 2010

Mniej wredne Google Docs ;-) - zabawy z OCRem część 2

Z dobrych wieści, już wiem czemu nie działało mi wrzucanie obrazków do OCRa w Google Docs :-)
Używałem złego mime type, zamiast poprawnego image/jpeg używałem image/jpg.
Co najlepsze rozważałem taki powód problemów, ale odrzuciłem go bo nie pasował mi komunikat otrzymywany od Google Docs. Kolejny już raz widać, że jak się ma wątpliwości to trzeba testować wszystkie dostępne opcje ;-)

I to by było tyle dobrego.

Eksperymenty polegające na tym, że robię zdjęcie moim G1, i wrzucam je do OCRa w Google Docs kończą się czymś co trudno nazwać sukcesem ;-)
List z Aurum który dostałem [znowu! pewnie znów im ich kryzysowy algorytm kazał wysłać list gdzie się da, a nóż ktoś się zgodzi płacić 16 złotych miesięcznie za konto ;-)] został rozpoznany jako dwie linijki tekstu [złego, ale tu wydaje się, że winą był język] jednego z nagłówków i cała reszta została zamieniona na czystą stronę ;-)
Znów pierwsza strona pierwszego rozdziału The Wisdom of Crowds została przerobiona na coś takiego [wklejam obrazek bo lepiej pokazuje ;-)]


oryginalny tekst na stronie wyglądał tak [z tym, że tutaj daję obrazek zmniejszony do rozmiarów 350x467, oryginał miał wymiary 1536x2048, gdzie pojedyncza wielka litera A miała ponad 50 punktów wysokości..... Google radzi OCRować teksty mające najmniej po 10 punktów na znak]:



Rezultaty nie są zbyt zadowalające :-)


Podobne postybeta
Wredne Google Docs
A ja wybrałem Xbox One ;-)
Rama... coś nie działa ;-)
Kryzysowy, pokręcony algorytm? ;-)
Android + Google Docs OCR = zestaw dla szpiega? ;-)