czwartek, grudnia 30, 2010

Podsłuchiwanie Chrome ;-)

Ha! A dziś "podsłuchałem" Google Chrome :-) dokładnie to co robi gdy rozpoznaje mowę :-)

Już tu pisałem o tym fajnym ficzerze, który można zobaczyć (w Chrome) w tym polu tekstowym:



[po prawej stronie pola powinien być mikrofonik, po którego wciśnięciu należy gadać].

Wygląda na to, że Chrome wysyła naszą gadaninę, jak się wydaje zakodowaną przy pomocy Speex'a [to wiem z zajrzenia do źródeł Chrome ;-)] do Google po HTTPS [bezpieczeństwo przede wszystkim!] pod adres https://www.google.com/speech-api/v1/recognize?client=chromium&lang=en&maxresults=3 z content-type równym "audio/x-speex-with-header-byte; rate=16000" [co jest sprytnie zahardcodowane w kodzie Chrome ;-)].
Wychodzi na to, że serwer bierze pod uwagę nagłówek Accept-Language i używa pierwszego znanego języka do rozpoznawania mowy.
Później przysyła JSONem odpowiedź i tam jest dopiero ciekawie :-)
Serwer przysyła do 3 najbardziej prawdopodobnych wersji tekstu, wraz z poziomem ufności dla najbardziej pewnego tekstu :-)
Odpowiedź wygląda tak:
{"status":0,"id":"6b68aa421c21b841bcba6368c26dc21e-1","hypotheses":[{"utterance":"this is a test","confidence":0.9484572},{"utterance":"this is the past"},{"utterance":"this is a past"}]}


Btw. wygląda na to, że możemy się za jakis czas spodziewać API do rozpoznawania mowy ;-)
Chociaż możliwe, że Google uzna jednak, że akurat tego lepiej nie jest udostępniać w zbyt wygodny sposób na zewnątrz ;-)

Przy okazji, gadanie które jest w Google Translate działa bardziej "po bożemu" ;-) Wystarczy wysłać requesta GET pod adres http://translate.google.com/translate_tts?q=to%20jest%20test&tl=pl&prev=input by Google Translate przysłało plik MP3 [audio/mpeg, może to nie jest MP3?] z powiedzianym "to jest test" :-)

Z innych ciekawych rzeczy, to chociaż już trochę z różnych okazji "podsłuchiwałem" Chrome to nie widziałem tam tych słynnych "szpiegujących" requestów :-) co wg. mnie podważa różne "teorie" o tym jak to Google "szpieguje".
Nie jestem oczywiście w stanie wykluczyć, że co jakiś czas [np. raz na 24h] leci np. krótki raport z informacjami o tym ile tabek było otwarte i ze średnimi czasami otwarcia], ale nie jestem przekonany co do tego by takowe były. Choć kiedyś trzeba będzie sprawdzić ;-)


Podobne postybeta
Google Maps 5.0 na Androidzie 1.6 wcale nie używa wektorowych map :-(
Spóźnialskie Google Latitude ;-)
Ha! Ochidna Echidna potrafi updatować pliki :-)
3 must have dla Chrome OS ;-)
Podobne posty i zachwyty nad nimi... ;-) i trochę o Java 7