Tervetuloa lahjoittamaan puhetta!

Keräämme puhetta suomea ymmärtävän tekoälyn kehittämiseksi. Jotta tekoäly oppii ymmärtämään meitä kaikkia, tarvitsemme valtavia määriä puhetta. Keräämämme puhe tarjotaan vapaasti kaikkien tekoälykehittäjien käyttöön. Puhuvat tekoälypalvelut tulevat olemaan merkittävä osa yhteiskuntaamme. Lahjoita sinäkin!

Alla kerromme hieman tarkemmin mistä on kyse, mutta jos haluat vain aloittaa, niin tässä tärkeimmät.

  • Keräyksen tarkoitus on edistää suomenkielisten tekoälypalveluiden kehitystä mahdollisimman laajasti.
  • Siksi kaikki puhe kerätään täysin vapaaseen käyttöön.
  • Lahjoittamalla hyväksyt, että lahjoittamasi puhe julkaistaan täysin vapaaseen käyttöön eli tekijänoikeussuojasta vapaan lisenssin alaisena (Creative Commons Public Domain, CC0).
  • Lahjoittaessasi sinusta ei tallenneta henkilötietoja, vaan ainoastaan puheesi ja satunnainen tunniste, jolla eri puhujat erotellaan toisistaan (esim. c378fb021a611a2).
  • Lahjoittaminen on niin helppoa, että nelivuotias lapsenikin sen osasi.

Miksi keräämme puhetta?

Puhuttua suomea ymmärtävän tekoälyn kouluttamiseen tarvitaan valtavia määriä puhetta. Keräämme puhetta vapaasti käytettäväksi, jottei jokaisen tarvitse toistaa tätä työlästä vaihetta.

Tekoäly on kuin lapsi, joka opettelee ymmärtämään puhetta. Tarvitaan lukuisia toistoja ennen kuin sanojen merkitys opitaan. Tekoälyn tapauksessa toistoja tarvitaan miljoonia. Lapsi oppii ymmärtämään puhetta vuosien mittaan, mutta tekoäly pystyy siihen tunneissa. Tekoäly kuitenkin tarvitsee valtavat määrät koulutusaineistoa eli puhetta, jotta oppiminen tapahtuu oikein.

Aluksi tekoäly täytyy opettaa muuntamaan kuulemansa puhe tekstiksi. Tässä vaiheessa tarvitaan puhetta ja sitä vastaavaa tekstiä. Tätä voidaan hankkia helposti lukemalla ääneen lyhyitä lauseita. Tärkeää on saada kerättyä mahdollisimman monenlaisten ihmisten puhetta, jotta tekoäly ymmärtää meitä kaikkia. Siksi aloitimme tämän kampanjan ja toivomme, että mahdollisimman moni teistä lahjoittaisi puhettaan ja pyytäisi perhettään, ystäviään sekä tuttaviaan osallistumaan.

 

Mitä tapahtuu kerätylle puheelle?

Puhe ja sitä vastaava teksti julkaistaan vapaasti kaikkien saataville. Verkkosivun kautta voivat kaikki halukkaat ladata koulutusaineistoa omalle tekoälylleen. Aluksi tarjolla on vain raakadataa eli äänitiedosto ja sitä vastaava (oletettu) teksti. Myöhemmin pyritään lisäämään koulutusta helpottavia tietoja, esimerkiksi näytteen laadusta. Pitemmällä aikavälillä pyritään julkaisemaan valmiiksi koulutettu tekoäly, joka pystyy kääntämään suomenkielisen puheen tekstiksi.

 

Kuka hyötyy kerätystä?

Kaikki. Sinä, minä, me, kaikki suomalaiset. Oppilaitokset, kunnat, valtio sekä pienet ja suuret yritykset. Korkeakoulut ja muut oppilaitokset saavat käyttöönsä koulutus- ja tutkimusaineistoa. Kunnat ja valtio saavat nopeammin ja edullisemmin puhetta ymmärtävään tekoälyyn pohjautuvia ratkaisuja käyttöönsä, esimerkiksi auttamaan ikääntyneitä toimimaan digitalisoituvassa yhteiskunnassamme. Yritykset pystyvät kehittämään nopeammin puheeseen perustuvia tekoälyratkaisujaan suomalaisten käyttöön sekä tekemään tuotekehityksen ja pilotoinnin kotimaassa ennen kansainvälistymistä.

Vapaalle puheaineistolle löytyy varmasti myös lukemattomia muita hyötyjä.

 

Miten voin lahjoittaa?

Alta löydät linkin ”Lahjoita puhetta nyt”. Siitä avautuu verkkosivu, jonka kautta voit lahjoittaa helposti puhettasi. Lahjoittaminen etenee seuraavasti:

  1. Avaat linkin.
  2. Kokeilemme toimivatko puhelimesi tai tietokoneesi äänet.
  3. Kokeilemme toimiiko mikrofoni.
  4. Näet lyhyen lauseen ja kuulet sen samalla ääneen luettuna.
  5. Toistat lauseen ääneen.
  6. Odotat että seuraava lause alkaa itsestään.
  7. Toistat lauseita niin kauan kuin viitsit.

 

 

Katso vielä videolta, kuinka helposti lahjoittaminen onnistuu: