Kuukauden Digilluusio: Google, haluan audiohaun

Google audio Digilluusio
Missä kohtaa lähetystä se tärkeä juttu sanottiinkaan… Google, kehitä tapa etsiä audiota!

Ei hakua äänellä, vaan äänen hakua

Jokapäiväisten askareiden hoitoon on saatavilla enemmän ja enemmän automatisoitua apua. Chatbotit yleistyvät sosiaalisessa mediassa (lue vuoden 2017 some-trendeistä) ja Amazon Echon kaltaiset digitaaliset apurit kodeissa. Käytämme ääniohjausta hallinnoidaksemme puhelimia ja hakeaksemme tietoa verkosta.

Voimme sanella laitteille ja sovelluksille käskyjä, mutta täydellinen systeemi ei vielä ole. Suomalaiset saavat odottaa vielä pitkään ennen kuin Siri tottelee omaa kieltämme, eikä englanniksikaan aina saa syötettyä tarkoitettuja termejä.

Ääniohjaus on yksi tärkeimmistä Internet of Things -innovaatioiden rakennuspalikoista, mutta ennen kuin se tukee kaikkia kieliä ja kykenee kunnolla suodattamaan dataa, asioiden internet on hitaasti toteutuvaa utopia.

Äänelle on kuitenkin muitakin käyttötarpeita.

Netti on täynnä videoita ja musiikkia. Niitä löytää esimerkiksi YouTubesta otsikon ja metadatan (tagit, tekstitykset) perusteella, mutta entä jos haluankin kuulla juuri tietyn kohdan biisistä tai podcastista? Ainakin iPhonen sisäänrakennetun podcast-sovelluksen kelausominaisuus (kelaus – miten retroa!) on kömpelö käyttäjälle, jonka sormet eivät ole viivoittimen paksuiset.

Audiofiili tarvitsee audiohaun, jonka avulla löytää juuri sen tietyn ääniklipin kirjoittamalla sopivat termit hakupalkkiin.

Esimerkiksi termit ”how did this get made” ja ”pussy flower” (kyllä, haen yleensä vain relevantteja juttuja) ohjaisivat minut tarkalleen oikeaan kohtaan suosikkipodcastini The Avengers -jaksoa ja nauttimaan Jason Mantzoukasin rivouksista.

Audion indeksointi on varmasti valtava tekninen haaste.

Hakusanat on helpohko tunnistaa, mutta audiota suodattaessa pitää tulkita äänenpainoja ja rytmitystä sekä puhujan äänialaa. Mahdollisuus etsiä hakutulosten kaltaisia ääniä Googlen kuvahaun tapaan olisi toinen harppaus. Jos Google vielä audiota hakiessaan toteaisi Kelsey Grammerin äänellä ”I’m listening”, järjestelmä hipoisi täydellisyyttä.

Perusta audiohaulle on kuitenkin jo olemassa. Nykyisten ääniohjauksella toimivien apurien ohella muun muassa Shazam-sovellus on jo pitkään auttanut löytämään, mikä biisi klubilla soi: sovellus käyntiin, mikrofoni kohti kaiuttimia ja muutamassa sekunnissa kappale on tallessa Spotify-soittolistalla.

Äänentunnistuksessa piilee haun (ja muunkin teknologian) tulevaisuus. Kenties tulevat sukupolvet jo päivittelevät isoisän koettelemuksia, kun ihan piti sormia käyttää laitteiden ja sovellusten hallinnointiin.

Tosin, jos kerrot lapsenlapsillesi tarinoita siitä, miten räpläsit puhelinta nuorena, olet aika tylsä vaari.

2017 New Year's Eve
Kiitos kuluneesta vuodesta kaikille lukijoille! Hurraakerkon vuotta 2016 muistellaan tarkemmin lähiviikkoina.

Easter Egg: Facebook helpottaa podcastien tuotantoa uudella Live Audio -ominaisuudella. Testattavana olevan ominaisuuden avulla FB-sivu voi purkittaa audioklippejä livenä. Lyhyen pohdinnan jälkeen vähän ihmetyttää, miksi ominaisuus hoksattiin lisätä vasta nyt – lieneekö syynä se, että ennen vain yksityisviestipalvelut mahdollistivat audioviestit? Joka tapauksessa on selvää, että Facebook pönkittää asemaansa juuri nyt -tapahtumien kotina.

Leave a Reply

This site uses Akismet to reduce spam. Learn how your comment data is processed.