Przeprowadziłem sprawdzenie skuteczności upolskawiania ;-) tekstów przy pomocy opisanego w poprzednim wpisie narzędziem. Wyniki nie wyglądają aż tak różowo ;-)Jeśli patrzeć na słowa to z przykładowego tekstu, w którym występowało 166 słów z polskimi znakami, mój program stworzył tekst z 96 słowami z polskimi znakami. Z tych 96 słów 2 były błędnie spolszczone. Daje to więc skuteczność spolszczania na poziomie około 57%Za źródło tekstu uczącego posłużył mi ponownie "Ostatni rozdział, czyli paragraf 22 bis" Josepha Hellera, zaś jako tekst na którym przeprowadzałem testy wykorzystałem treść tego newsa z Wirtualnej Polski.Jeżeli uda mi się "wyszpanować" wyniki do powiedzmy 70% to pomyślę o praktycznym wykorzystaniu tego narzędzia w moim Gadaczu :-)
Podobne postybeta
Jak automatycznie zmienić słowo "laka" w "łąka"? :-)
DRM Google wcale nie został złamany
"Doskonalenie" upolskawiacza ;-)
Dziś programista ma być teoretycznym algorytmistą, a praktycznym kleistą ;-)
Działa :-)
wtorek, kwietnia 17, 2007
Subskrybuj:
Komentarze do posta (Atom)
Brak komentarzy:
Prześlij komentarz