Päivityksiä aiheista:
AWS ja text-to-speech / speech-to-text – kokeilu, Karhureitti iot-kokeilu ja Robosota
Hacklab kokoontumisissa olemme keskustelleet muutamista projekteista/kokeiluista liittyen seuraaviin aiheisiin sivuten mm. Tehdas Ry:n kanssa tehtävää yhteistyötä:
- AWS tekoälymallin kehittäminen ( text-to-speech – kokeilu)
- AWS tekoälymallin kehittäminen ( speech-to-text – kokeilu)
- LoraWan karhureitti iot-kokeilun jatkaminen
- Robosota
Hacklab osallitui Tehdas Ry:n koenäyttelyyn 25.3. toteuttamalla pienen konepuhe-kokeilun hyödyntäen chatGPT:llä muokattua vaihtoehtohistoria : tehdas-hacklab-experiment-1
Tarkoituksena oli jatkaa kyseistä kokeilua interaktiivisempaan suuntaan käyttäen esim. Helsingin yliopiston Lahjoita puhetta kampanjassa kerättyä dataa/tekoälymalleja. Tähän on tarkoitus käyttää yhdistykselle (Tivia Satakunta Ry) hankittuja AWS credittejä.
1. AWS, text-to-speech kokeilu
AWS, text-to-speech-kokeilussa ideana oli että voitaisiin opettaa suomeksi omalla ääni. Tämä kuitenkin osoittautui aika vaikeaksi. Text to speech custom voice on vaikea rasti suomeksi: https://github.com/coqui-ai/TTS/blob/dev/TTS/.models.json#L512 tämä näyttää olevan lähimpänä sitä: https://huggingface.co/neongeckocom/tts-vits-css10-fi/tree/main malli siis löytyy avoimena mutta ei reseptiä. Toki mallitiedostosta löytyy pythonia, mutta sillä tuskin pääsee eteenpäin.
Ja valmiit vaihtoehdot Azure / Google eivät vielä tue custom voicena suomen kieltä.
Eli tämä kokeilu menee nyt jatkoajalle, odottamaan vaikka helppoa vaihtoehtoa että joku pilvipalvelutarjoajista tarjoaa custom voice:a tai ilmaantuu hyvä opensource-vaihtoehto.
2. AWS, speech-to-text kokeilu
Tässä kokeilussa ideana on saada tehtyä omaa puhetta ymmärtävä kielimalli. Tähän erityisesti on ajateltu että voitaisiin hyödyntää seuraavia opensource lähteitä:
AWS:ssa scriptin harjoittelu simppelillä koneella tai omalla koneella ennen kuin ottaa ns. kalliin koneen.
AWS konetyyppejä mitä kokeiluun on mietitty (kokeilussa tarkoitus saada myös oppia mitä opetus/käyttö maksaa):
p3.16xlarge, opetukseen
p4d.24xlarge, opetukseen
g5.2xlarge, opetukseen
g4dn.2xlarge, inferenceen (0,74 USD)
g5.xlarge, inferenceen (1 usd)
g4dn.xlarge, inferenceen (0,54 USD)
Tämä kokeilu on alkamassa, ja vaikuttaa mahdolliselta. Toki yksinkertaisempia vaihtoehtoja on muualla kuin AWS:ssa ( Transcribe ) suomenkielen osalta: esim. https://cloud.google.com/speech-to-text/pricing . Azurelta löytyy myös suomi-tuki stt-muunnoksessa.
3. Karhureitti-iot-kokeilu
Tätä aihetta on tässä blogissakin käsitelty. Nyt ongelmaksi on muodostunut että low-code- ja no-cost-vaihtoehdon samanaikaisuus ei onnistu. Eli pari vuotta sitten hyväksi todettu pipedream-palvelun ilmaisvaihtoehto ei enää ole keväästä 2023 alkaen riittänyt välittämään lähes realiaikasta dataa kuin n klo 12 asti ( löytyy linkki myös täältä: Free for Developers (free-for.dev) ).
Tämä kokeilu jatkuu että teemme syksyllä uuden jatkokokeilun lähinnä tutkiaksemme uutta kävijälaskuritekniikkaa, epäily nyt on että anturi on liian herkkä esim. keväisin valon/vesipisaroiden suhteen (kasvillisuus?).
Sen sijaan on todettava että esim. jos lähes reaaliaikaista dataa haluaa, niin low-code ja NO-COST-vaihtoehtona tätä ei enää tässä kokeilussa voi jatkaa. Sen sijaan voin saada mittalaitteen ylläpitämää kävijämäärän päivitystä tietyin aikavälein tässä tapauksessa kerran päivässä. Tarkalleen ottaen nyt kuluna on ollut ainoastaan LoraWan-tukiaseman käyttämä internet-yhteys Elisan laitenetin avulla alle 10e/kk, eli sikäli nykyinenkin ratkaisu on aiheuttanut jatkuvia kuluja.
Kokeilun dataa edelleen siis kerätään kävijälaskureiden ja halkopainolaskurin osalta tänne ( google sheettiin ): https://docs.google.com/spreadsheets/d/e/2PACX-1vSlfTYkjc-NtnWM9nUAJoYllV7VrcXUwha1S3hBpL_rvyr5Y_YUKa0FnWC7OVHN1EWCKbCQkX362iBe/pubhtml
4. Robosota (Robowars)
Pori Hacklab oli edustettuna ”Second Date”-robotilla robosota.fi :ssa ks. video https://youtu.be/BlpNTW3xweo .