Radim Vysoký: Jak design a AI mění výuku hry na hudební nástroje

2FRESH
24 min readSep 10, 2024

--

Přepis rozhovoru

Radime, představil bys nám ArtMaster, ale i Artieho AI učitele a proč to vlastně celé vzniklo?

ArtMaster je místo, kam lidi chodí se naučit hrát na hudební nástroje. Většinou začátečníci. A celý to vzniklo v podstatě úplně v počátku proto, že jsem byl nespokojený, když jsem jako malej, musel chodit do ZUŠ a musel jsem tam hrát Bacha a Mozarta a vlastně mě to nebavilo, protože jsem vždycky chtěl hrát Green Day a Nirvanu.

Představoval jsem si sám sebe na stage, jak hraju rock’n’roll a místo toho jsem musel cvičit ty etýdy a tu jednu skladbu, kterou jsem pak hrál na nějaký soutěži. Takže jsem byl nespokojený s tím, jak byla ta výuka nastavená v České republice — jak je to oldschoolový systém výuky hudby, ale neexistovala pro mě vlastně ani jiná možnost, jak se naučit hrát ty své nejblíbenější písničky, které jsem miloval, když jsem vyrůstal. Takže když jsem dokončil vysokou školu v Praze, založil jsem hudební školu, která je fyzická a doteď vyučujeme cca 200 lidí v lekcích 1:1.

A pak při Covidu, když jsme museli školu zavřít, tak jsme to vnímali jako příležitost expandovat do online prostředí a začali jsme natáčet výuková videa, ze kterých se staly online kurzy ArtMaster v češtině. A potom jsme začali expandovat i na zahraniční trhy. V tuto chvíli expandujeme hlavně do USA, kde máme aktuálně přes 40 % nových zákazníků.

Artie, kterého jsme si tady pouštěli, tak to je v podstatě náš úplně nejnovější prototyp produktu, na kterém teď pracujeme. Je to AI učitel, který má pomoc našim žákům, aby se naučili zahrát tu svoji písničku ještě rychleji. My tím, že provozujeme fyzickou hudební školu v Praze a zároveň i prodáváme online kurzy, tak jsme si uvědomili, že každé to prostředí má svoje plusy a mínusy.

Fyzická škola je skvělá, protože máš u sebe lektora, který tě vnímá a dává ti okamžitou zpětnou vazbu na to, když uděláš chybu a v podstatě může upravovat výuku podle přání žáků. Ty online kurzy jsou zase strašně dobře dostupný, většinou levný, takže si je můžeš koupit a učit se odkudkoliv. Stačí mít jenom připojení k internetu. Ale zase tam chybí ta zpětná vazba a personalizace té výuky.

Takže Artie — AI učitel hudby — je v podstatě přirozený vývoj toho, kdy se snažíme spojit tyhle dva světy a nabídnout našim žákům zpětnou vazbu a personalizaci skrze toho AI učitele.

A ještě by mě zajímalo, co byl nějaký moment, kdy jste si řekli, že se pustíte do toho AI učitele? Jestli jste najednou viděli, že ty technologie už jsou dneska tak daleko, že tohle je ta cesta dopředu, nebo jestli tam byl nějaký jiný impuls?

My už jsme viděli, že ta technologie je tak daleko, že jsme podstatě schopni tohle docela rychle vyvinout za pomocí velmi šikovných lidí tady v České republice, kde máme fakt hodně nadaný programátory a AI vývojářů. A pak jsme si říkali, že v kombinaci s designem od vás v 2FRESH to bude totální bomba. A tak jsme na tom začali dělat.

Lukšo, pamatuješ si, kdy jsi nám s tím začal pomáhat?

Všechno tady máme napsané. První schůzku nebo intro jsme měli na začátku 6. listopadu 2023 a už 9.listopadu 2023 byl první Deep Dive. Tenkrát s náma na tom ještě dělala Bára. A tady jsme dávali dohromady brief. Vy jste hlavně mluvili o tom, že to má mít ten feedback. A že to má být personalizovaný pro každého člověka a osobně si ho to má pamatovat. Že to má být zábavnější než jsou dneska kurzy.

Radime, chceš mě doplnit?

Ten hlavní cíl, proč lidi většinou začínají hrát na hudební nástroje, tak je, aby si zahrali svoje oblíbené písničky. Našim cílem je naučit je ty písničky, které milujou co nejdřív, ideálně po první lekci, a nebo první den, nebo po prvním týdnu. A pomocí toho AI učiteli právě dokážeme personalizovat tu výuku, že si bude moct vybrat tu svoji písničku a okamžitě se ji začít učit.

Takže se nesnažíme lidi nudit nějakou zdlouhavou hudební teorií, když je to třeba nezajímá. Naši žáci jsou většinou spíš takoví hobíci, co si třeba plní sen z dětství. Takže to nejsou lidi ambiciozní na to, aby se z nich stali profesionální hudebníci — tihle lidi většinou jdou na konzervatoř nebo se tomu fakt věnujou na fulltime. My jsme tu pro všechny ty ostatní. A to jsou většinou lidi, kteří si chtějí buď zahrát nějakou písničku u ohně, když jsou na chatě, nebo si chtějí zahrát s kamarádama, nebo mají třeba zrovna čerstvě rodinu a chtějí své děti přivést k hudbě.

To je docela zajímavé to, “aby to bylo zábavnější”. To mi připomnělo jednu historku paní učitelky, kterou má moje dcera na hudebku ve škole. Moje dcera chodí do 3. třídy a ta jejich učitelka říkala, že kdyby chtěla děti odradit od hudební výchovy, tak by je učila podle osnov pro hudební výchovu. Proto jim pouští moderní písničky, který ty děti baví. Taková paralela k tomu, co jsi říkal.

Lukšo, mě by zajímala tvoje role. Jestli by si trochu přiblížil, co ty v rámci ArtMasteru děláš?

Tak my se s Radimem známe dlouho a s Majkláčem dokonce ještě dýl. Já jsem klukům před 2 lety pomáhal připravit se na vstup na americký trh. Dávali jsme spolu dohromady brand, webovou aplikaci, na které potom dělal IT Lab. To zadání od kluků bylo, aby to vypadalo exkluzivně. Tenkrát tou naším metou byly stránky Masterclass. Takhle kvalitní měl být ten předobraz a skutečně, když se podíváte dneska na to, jak ArtMaster vypadá, jakou to má produkci kolem toho všeho, tak je to opravdu na světové úrovni.

Takže my jsme to měli vlastně jenom nepokazit a ten brand dopadl nějak takhle. Je oranžovej, protože vyjadřuje hodnoty kluků, který kolem ArtMasteru mají — jsou nadšení do hudby a snaží se to vlastně pro ty studenty udělat co nejjednodušší a příjemný.

Já jsem byl na tom projektu takový průvodce kluků. Snažil jsem se do toho vnášet designové principy, mezi které patří to, abychom pokud možno ihned něco vyrobili. Takže hned od druhé nebo třetí schůzky jsme měli nějaký hnusný prototyp, abychom hned měli nějaký feedback, že ty věci nefungují. A já jako ten průvodce, jsem se vždycky staral o to, aby v tom projektu bylo jasno. Takže abychom měli ze všeho zápisy, abychom se k těm věcem mohli vracet, aby bylo jasné kdy, co bude hotové, Což se teda ne vždycky úplně skvěle dařilo, ale nakonec jsme to dokázali.

Radime, jak vlastně vypadá tým, který na Artriem pracuje? Rád bych si dneska hodně povídal o tom procesu vývoje AI učitele. Tak mě určitě zajímá, jak ten tým vypadá v detailu.

Já s Majkláčem jsme spoluzakladatelé ArtMasteru, takže ta myšlenka vznikla mezi námi. Začali jsme se o tom bavit a představili si, jak by to reálně mohlo fungovat a co by to teda mělo být — jaký by to mělo mít charakter, když tu aplikaci zapneš, co by ti to mělo dát a hlavně, jak by to mělo pomoct našim žákům. Když už jsme si o tom povídali dost dlouho a řekli jsme si, že to je podle nás dobrý nápad, tak jsme se vzápětí spojili tady s Lukšou a s vámi v 2FRESH, aby to začalo mít nějakou strukturu a abychom začali tvořit a zhmotňovat toho Artieho do nějaké podoby.

Já jsem si to od začátku představoval trošku jako Siri, nebo nějaké kolečko, co na tebe mluví a dává ti feedback. V podstatě mě nic jiného v tu chvíli nenapadlo. Ale protože Lukša umí vždycky velmi rychle a šikovně zhmotnit ty naše nápady a šílenosti co si vymyslíme, tak to zašlo dostávat nějakou podobu, která se nám začala líbit. A postupně se to tvarovalo a tvarovalo, až to začalo dávat smysl.

Definovali jsme si, co by ten prototyp učitele všechno měl umět a co by měl splňovat. A na základě toho začal Lukša kreslit první designy. V podstatě začal designovat charakter toho učitele, což pro nás bylo něco úplně nového. Protože ten Artie má nějaký hlas, má nějakou podobu, má nějaké reakce a emoce — jak na tebe reaguje a jak se chová. Takže to bylo strašně zábavné. To mě opravdu bavilo, když jsme to spolu probírali.

Když jsme pak od vás dostali asety k tomu, že jsme mohli vytvořit prototyp, tak jsme to předali vývojářům. Na doporučení jsme se snažili najít ty nejlepší vývojáře v Praze, kteří už mají zkušenost s vývojem podobné aplikace. Firmu, která umí rozeznávat a analyzovat zvuk a na základě toho pak pomocí AI reagovat a vyhodnocovat zvuk podle toho, co slyší. A ti začli připravovat prototyp. A docela rychle, snad během asi 2 měsíců jsme dostali prototyp, který jsem byl schopný si už odvézt do Ameriky. Koupil jsem si k tomu takové malý piánko, abych to mohl ukazovat v Americe lidem a investorům, jak to funguje. A v mobilu už mám první prototyp, který umí nějaké základní věci, o kterých jsme si řekli, že to má umět.

Takže ten tým, který na tom vlastně pracoval na začátku, jsi byl ty, Majkláč a Lukša. A když jste vytvořili koncept, tak jste do toho vzali vývojáře, kteří zhmotnili ten první prototyp.

Ano, to je ten core team. Ale pak nám s tím pomohli další lidi. Tím, že máme školu v Praze, kde máme 20 lektorů, kteří jsou fakt skvělí, tak jsme to s nimi hodně konzultovali. Obvolal jsem všechny naše lektory piana a ptal jsem se jich, jak vypadá jejich první lekce s žákem — co je učí, nebo jak reagují, když udělá nějakou chybu.

Takže jsme se opravdu snažili, aby se Artie choval co nejvíc podobně tomu, jak by se choval reálný lektor na hodině. Zjišťovali jsme, jaký druhy chyb dělají nejčastěji začátečníci a jak na to reaguje učitel. Jestli jim vymyslí cvičení na míru, nebo jaké jsou ty všechny možnosti.

Na základě toho jsme pak vymysleli celý strom možností, co může nastat a co ty začátečníci nejčastěji dělají a kolem toho jsme to pak postavili.

Potom máme copywritera z UK (Matt) a ten pomáhal s texty, aby všechno bylo správně v angličtině.

Taky jsi Radime zmiňoval, že jste za námi do 2FRESH přišli, abychom přinesli nějakou strukturu do toho vašeho počínání.

Tak by mě Lukšo, zajímalo, jestli by si nám ukázal design proces, kterým jste procházeli. Ty už si to zmiňoval, že to bylo rychlé zhmotnění myšlenek, aby kluci mohli dát rychle feedback a pak jste nad tím iterovali. Máš nějaké highlighty z toho procesu?

Ano. Mám rád dvě věci. Když je ta spolupráce intenzivní a máme checky ideálně každý den, protože každý den musíme těm lidem, kteří nám věří, něco doručit. Potom se to posouvá rychle dopředu. Tady jsme tu intenzitu měli co 3 dny.

A tou druhou věcí je to, že všechno, co děláme, je zaznamenané deníčkovým způsobem. Takže když se potom o tom spolu bavíme, tak to není abstraktní, ale koukáme na konkrétní věci, ukazujeme si je a můžeme je rovnou měnit. A to si myslím, že je ten magic, který nás společně jako tým strašně rychle posouvá dopředu. Umožňuje nám ty iterace zkracovat a odstraňovat všechny bariéry, které možná v tom hmotném světě a remote světě vlastně jsou. A umožňuje nám z těchto podmínek dostat úplně to nejlepší.

A když mluvím o prototypech, tak to jsou opravdu jakýkoli možný prostředky toho, jak vyjádřit, kdo z nás má jaký nápad. Takže to, co jste viděli ten úplně první prototyp — jak říká Matěj Kanický Something to hate — tak to byly vygenerované přes chatGPT takové trošku debilní obrázky toho, jak by vypadal setting: takovej jako newyorský pokoj s velkými okny a pianem uprostřed pokoje. BTW Radime, takhle to vlastně nakonec dopadlo, akorát co se toho settingu týká, tak tam není chlápek, ale krásná černoška. A to, že máme takovouhle první věc, u které vidíme, co je na tom hroznýho, tak nám umožňuje se nad tím dál bavit a rychle se od toho odrazit — udělat nějaké další verze, další propozice, další návrhy.

A jak Radim mluvil o tom stromu možností, tak my jsme za začátku začínali snad s nějakými čtyřmi cestami, že jsme chtěli dělat čtyři scénáře. Nakonec z toho byli dva scénáře a ve finále je to video asi polovina prvního scénáře, protože jinak by to bylo úplně strašně dlouhé.

Myslím, že hned na začátku jsme se rozhodli udělat ten prototyp formou videa, protože z toho videa na každého člověka nejvíc dýchne, jaký je potenciál takové věci.

Ten důvod, proč jsme to dělali je, že jsme chtěli vytvořit nějaký artefakt, technologii, která dává lidem feedback a dává jim to, co ty osobní kurzy nemůžou. A právě na tom videu je něco, co je vidět úplně nejlépe. A tohle byl ten artefakt, ke kterému jsme mířili, který jsme chtěli udělat. A samozřejmě to nebylo tak jednoduché, že jdeme dělat pouze video, ale museli jsme přemýšlet daleko, daleko dál za to, jak ta věc vlastně bude fungovat, jak má vypadat, jaké tam jsou patterny chování a tak dál. Aby to bylo uvěřitelné a aby to celé fungovalo dohromady.

Co si Radime pamatuju, tak jeden z těch cílů bylo tímto artefaktem vzbudit zájem a získat nějaké další příznivce, které pomůžou ArtMaster rozvíjet dál. Je to tak nebo jak vlastně tohle dopadlo?

Tak já myslím, že hlavní cíl toho videa bylo, aby kdokoliv, kdo si to pustí, okamžitě pochopil, co to je. To byl ten hlavní cíl. Protože popisovat někomu něco, co neexistuje a je v tom AI a nemáme nic v ruce, to je těžké. Cílem bylo vytvořit tohle krátké video, co jste viděli na začátku. Aby úplně každý, i lidé, co nejsou technický a co vůbec neví, co je ArtMaster, tak aby z videa pochopili, co to má dělat a k čemu to je dobré.

My jsme si testovali i víc variant. Pouštěli jsme to lidem a dělali jsme takový malinký průzkum, kdy jsme zjišťovali, jestli lidé pochopili, co se v tom videu děje a k čemu je ta aplikace dobrá. Abychom si ověřili, že když to pak natočíme, tak to dává smysl. A myslím, že se nám to podařilo. Že když si to kdokoliv pustí, tak mu je hned jasné, co Artie je, jak se chová a co je jeho cílem.

Takže to si myslím, že byl úspěch. Je to v podstatě styl prezentace té naší vize, čeho chceme dosáhnout a na čem pracujeme. Takže když se teď s někým bavím, volám a řeknu mu, děláme AI učitele hudby a jsem třeba na ulici, tak mu můžu jednoduše přeposlat link na to krátké video a on hned pochopí, na čem pracujeme.

Mně na tom přijde zajímavé to, že obvykle, když se dneska navrhují mobilní aplikace, tak ty prototypy jsou standardně proklikávací prototypy ve Figmě. A tady se mi líbí, že to video plní víc účelů.

Zároveň, když to uděláš jenom jako proklikávací prototyp ve Figmě, tak je docela výzva to konverzační rozhraní zachytit, jak to reaguje. Nebyl to také důvod, proč to video udělat? Zamýšleli jste se nad tím, jak to v tom klikacím prototypu vizualizovat, nebo jak to ukazovat i jinak, Lukšo?

Možná chvilku na začátku. Ale to video byla poměrně rychlá volba v tom, že je ten nejsnazší způsob, jak zprostředkovat ten zážitek. Kdybychom vyráběli celou aplikaci nebo jakkoliv mockovali ten prototyp, tak by bylo mnohem složitější k lidem dostat, co to dělá.

Ale máš pravdu v tom, že to pro nás byla poměrně nová zkušenost. Já, když jsem se do toho pouštěl, tak jsem si nakoupil tři knížky o konverzačním designu a rychle jsem je všechny přelouskal, abychom se tam nedopustili žádného designového hříchu. A když jsme se blížili do toho finiše, tak to bylo jako lazení každého slova a brutální zkracování všech možností a slov, které se v tom všem mohou vyskytnout.

Protože jeden z těch velkých cílů bylo to, že se na ten displej pomalu člověk ani nemusí podívat. Že to funguje jako kdyby vedle tebe byl skutečný učitel hudby a říkal ti, co máš dělat a ty jsi to z toho musel chápat. Žádný dotyk není zapotřebí.

Ale zároveň musíš mít teda hodně vyladěné detaily interface, který se objevuje ve videu, protože udělat změnu potom v tom videu může být docela náročné, ne? Oproti tomu, když ve Figmě přepíšeš dvě slova a hned to vidíš v tom prototypu.

My jsme si na to udělali takový malý design systém, aby ty změny byly možné. Takže ve Figmě jsme si navrhli všechny komponenty. Mezi takové komponenty patří třeba to, že máš ruce ve všech možných polohách, které jsme si k tomu rendrovali. A mít k tomu vymyšlenou a nadesignovanou celou klaviaturu, kterou jsme překreslovali v několika verzích. Každou z těch kláves. Samozřejmě aby šli měnit barvy, když zjistíme, že něco nefunguje. Nebo když narazíme na něco nového, co je potřeba změnit, tak abychom to nemuseli všechno strašně náročně překlikávat.

Bylo takové kombo, kde já jsem připravoval věci ve Figmě a Patrik Stanko (AKA Vlaso) to potom celé skládal dohromady a vyráběl finální animace v After Effects.

A než jsme se k tomu dostali, tak jsem tady chtěl v krátkosti ukázat nějaký iterace a přemýšlení, které jsem nad tím měl. Já jsem od začátku chtěl, aby to vypadalo opravdu cool a futuristicky. Představoval jsem si různé práce s takovými hyperrealistickými a futuristickými tvary, které dneska i v té hudbě jsou a jsou takové alternativní. Anebo jsou to úplně designový úchylárny, které zavánějí sci-fi tématikou.

A tohle všechno jsme explorovali a jedna z těch kláves, která se mi obzvlášť líbila, a asi dobře, že to Majkláč nakonec zaťápnul, tak byla taková jako monochromatická klaviatura.

Bylo jasné, že z toho chceme dostat takový neonovo zářivý look and feel. Takových těch rukou, které známe z VR aplikací, které jsou poloprůhledný a člověk z toho pořád velmi dobře cítí všechny ty detaily, které na té ruce jsou. Takže rozeznáš krásně od sebe prsteníček, palec atd. Ty explorace potom pokračovali k feedbackům, o kterých mluvil Radim. Kde ukazujeme například to, že člověk hraje třeba jedním prstem slabě. Zkoumal jsem různé polohy toho natočení, jak to ukázat a jakou barvu na to použít, aby ten feedback byl křišťálově jasný. Takže tady je pár takových iterací, kdy jsme zkoušeli různé náklony kláves. To samozřejmě pak mělo jako vliv na ten obrovský objem práce, který se dělal v AE.

A co ještě bylo zajímavé a co jsme objevili úplně ke sklonku, a nakonec se to ukázalo jako super efektní — a tuším, že o měsíc a půl později s tím přišel i Apple na svém WWDC — tak byl vlastně feedback, který ta aplikace dává formou rámečku. Když něco hraješ a něco se povede nebo nepovede, tak ta appka zazáří od svých krajů zeleně, když je to dobrý a nebo opačně červeně, když to dobrý není. A brzy to budeme mít vlastně v iOS 18. Tak to byl asi takový zajímavý fun fact tady z toho.

Já to jen doplním. Tohle se strašně lidem líbí. Když to pustím na mobilu v tom prototypu, tak to vypadá ještě 10x líp, než to je vizualizované tady. Jak se krásně rozsvítí ten rámeček kolem toho mobilu, tak je to strašně příjemné na to koukat. Takže tam přijde jako opravdu skvělý nápad. To se tobě i Appleu povedlo.

U čeho bych se ještě pozastavil, než skočíme do těch AE, tak byly explorace těch výrazových prostředků, kterými Artie komunikuje. On když poslouchá, tak to jsou vlastně takovéhle tvary, které vychází z loga ArtMaster, respektive z toho doplňkového tvaru.

Bylo veliké dobrodružství tyhle ty tvary objevit, aby to nebyl jenom takový ten debilní zvukový wave, ale mělo to nějaký jako lidský charakter. Nebylo to úplně okoukané a byla z toho cítit ta živost a organičnost těch věcí. Takže tady jsou různé finálnější explorace toho, jak Artie komunikuje nebo poslouchá.

Ale než jsme se tady k tomu dostali, tak to bylo takový pěkný halucinování nad tím. Jedny z úplně prvních návrhů, které mě se teda moc líbily, ale Majkláčovi to spíš připomínalo prdel. Ale je v tom ta naše hvězdička, úplně to spolu mohlo dobře fungovat a otvírat to tu pusinku… úplně to vidíte, jak to dělá. Ale bohužel to teda připomíná tu prdel, tak jsme od toho nakonec ustoupili. A ještě k tomu byla taková krásná monochromatická varianta.

Ale pak to začalo jít do hodně zajímavých poloh, kdy jsme z toho vlastně udělali takový živoucí systém. A to jsme byli opravdu jenom kousíček od toho, jak to dneska vypadá a funguje. Byla to velká zábava tyhle věci prozkoumávat. A ještě větší zábava byla v těch AE to rozhýbávat s takovýma supersložitými náročnými pluginy. Nějakých pár dní jsme v tom vytuhli, aby se to hýbalo tak, jak se to hýbe.

A ještě bych chtěl ukázat, jak to fungovalo a vypadalo v těch AE. Takhle vlastně vypadá ta finální animace, co v té aplikaci dneska vidíme. A pod tím je naložená úplně celá kompletní klaviatura, kde se animují jednotlivé tóny, které tam seshora přitékají. Pod tím je komponenta, ve které se ty klávesy zapínají a vypínají. A to celé se skládá z jedné klávesy, která nabývá tady těch možností. A když to z té Figmy přeexportujeme sem, tak se to všude změní. Takže se to nemusí celé ručně předělávat.

Tady je ten plugin Form, kterým jsme to tunili, ladili a reagovalo to na všechny ty tři důležité frekvence, které v tom hlasu jsou.

Konec technického okénka.

Radime, ty jsi zmiňoval, že už máte ten prototyp a že na to lidi reagují nadšeně. Třeba ten rámeček, jak se rozsvěcí. Zároveň jsi zmiňoval, že jste seděli s těmi učiteli hudby a mapovali jste, jaké dělají nejčastěji žáci chyby, na co dávají zpětnou vazbu a tak. Tak to by mě možná zajímalo, jak jste si sbírali tyhle data k tomu, jak to postavit správně. Jestli jste ten koncept a ten prototyp s někým testovali. Jak tohle probíhalo?

My jsme vycházeli z nějakých našich zkušeností. Já jsem učil hudbu 7 let. V podstatě celou dobu, co jsem studoval v Praze, tak jsem si přivydělával tím, že jsem učil. Neučil jsem teda piano, ale učil jsem kytaru, ukulele a trošku hru na piano. Majkláč je celoživotní hudebník, taky se zrovna učí na piano. Takže v podstatě jsme vycházeli z našich zkušeností, ale pak jsme hodně dali na ty naše lektory, protože ti se opravdu potkávají s těmi našimi žáky a začátečníky každý týden několikrát. A ví, co jsou ty blockery, které překáží v tom, aby si lidi zahráli tu svojí první písničku. A ty jsme se snažili identifikovat.

Těch chyb, co začátečníci dělají, není zas tak strašně moc. Takže my jsme vzali ty úplně nejdůležitější a ty, co se nejčastěji opakují a v podstatě na základě nich jsme se snažili zjistit, jak je co nejrychleji překonat.

A většinou to řešení je takový, když si chceš zahrát svojí první písničku, kde střídáš dva akordy a máš problém ve výměně těch akordů, tak chceš vymyslet cvičení, které ti pomůže s koordinací ruky, abys dokázal ten akord vyměnit rychleji. Takže tady ten problém má řešení v nějakém cvičení, které ti Artie připraví na míru podle toho, jakou chybu děláš. V tom vidíme tu sílu toho, co Artie bude schopný udělat.

A ta dlouhodobá vize tam je taková, že Artie bude schopný vygenerovat cvičení, které třeba ještě ani nikdy nikdo nezkusil, a to na základě toho, jaké ti naši studenti budou dělat chyby. A potom, co nasbírá dostatek dat, tak bude vědět, které cvičení a pro jaký typ žáka bude nejefektivnější. Takže uděláš chybu a Artie ti řekne: tady hraješ špatně malíčkem a 16 tisícům lidem před tebou pomohlo nejrychleji zbavit se této chyby přesně tohle cvičení. A v podstatě pomocí machine learningu bude Artie schopný sbírat data a sám se vylepšovat v tom, aby vždycky nabídnul žákům to, co jim pomůže nejrychleji.

Vy kolem toho máte asi spoustu takových nápadů, jak ten produkt dál rozvíjet — může se to učit, vymyslí to nové cvičení, pozoruje to tu efektivitu a když to nasbírá hodně dat, tak to může dál optimalizovat. Máte tyhle nápady někde nějak organizované? Máte na to Radime nějaký backlog nebo nějaký nástroj, kam to zaznamenáváte? Nebo to spíš teď žije ve vaší hlavě a jste soustředěný na to vyrobit ten prototyp a posouvat to dál?

To, co jsi teď popsal, je vize do budoucna a spíš to žije v naší hlavě. Neustále se o tom bavíme spolu a vymýšlíme, jak by to mohlo fungovat. Ale tím, že já ani Majkláč nejsme programátoři a nejsme úplně tak techničtí, tak se právě dost často potkáváme s foundery jiných startupů, kteří jsou techničtí, rozumí AI a ví, co je vlastně možné technicky udělat, abychom si v podstatě zvalidovali, že to nejsou jenom nějaké naše šílené představy, které nejsme schopni zrealizovat.

Takže jsme se potkali s Filipem Dvořákem z Filuty AI a dalšími foundery, kteří dělají na jiných podobných projektech, abychom zjistili, jakým způsobem by k tomu přistupovali oni a nechali jsme si dát nějaké doporučení, na co se soustředit a třeba jakého člověka zaměstnat, aby nám pomáhal to vyvinout dlouhodobě.

Zmiňoval jsi, že nejste vývojáři ani jeden z vás nejste techničtí. Ale zase máte obrovskou expertízu v té hudební doméně. Tak by mě zajímalo, jaké největší výzvy jste řešili právě tím, že nemáte tak hlubokou technickou znalost. Bylo pro tebe a Majkláče hodně komplikované, když jste se do toho pustili?

Nemáme to tak, že si vymyslíme úplnou šílenost a pak teprve zjišťujeme, jestli to jde udělat. Spíš zjistíme, že to jde udělat a jsme překvapení, že jsme nevymysleli úplnou blbost. Ale proto se hodně často potkáváme s jinými foundery startupů a ta komunita těch founderů je hodně sdílná a všichni si strašně moc pomáhají, což je úplně skvělé.

Vím, že jsou jiné české startupy, které jsou hodně DeepTech nebo technické, anebo využívají AI. Vím, že jim můžu napsat, pozvat je na kafe nebo na drink a oni nám rádi dají konzultaci. Řeknou nám: hele, tohle je úplná blbost nebo tohle je super nápad a k tomuhle musíte využít tady toho člověka, který vám to naprogramuje. Takže my v podstatě hodně těžíme z té komunity founderů a doporučení lidí, kteří jsou technicky zdatní a kteří reálně tomu rozumí a jsou schopni to naprogramovat.

Já mám podobnou zkušenost. Přijde mi, že lidi na tech scéně v Čechách jsou velmi otevření. A možná i všude ve světě, že ty lidi z tech segmentu se o to rádi podělí.

Lukšo, jaké jsi řešil největší výzvy z pohledu designu? Ty už jsi ukazoval spoustu docela nestandardních věcí, kterými jste procházeli, tak jestli ukážeš nějaké zajímavé věci z toho designového procesu nebo výzvy, na které jsi tam narážel.

Bylo celkem náročné — zpočátku jsme v tom plavali. Ale to si myslím, že je na tom krásné, protože to všechno můžeme vyzkoušet a můžeme vidět, jak to funguje — narvat to všechno do té obrazovky, která je malinká. A od začátku jsme si dávali takové omezení, aby to fungovalo na obyčejných mobilech, na iPhonech nebo Androidech.

A ta představa, že narveš do tak malého místa tolik informací pro člověka, který to piano vidí poprvé a nerozliší C od G, tak najít tu pravou míru toho, kolik těch informací tam dát. Nebo jakou tomu všemu dát vizuální váhu, protože všechno tam prostě být nemůže. A myslím, že to je hezky vidět tady na těch exploracích, kdy tu přibývají různé vertikální linky, které ukazují rytmus. Bavili jsme se s Radimem o tom, že by tam mohl být i nějaký metronom, který by pomáhal lidem držet rytmus. A mít tam i linky, které směřují opačným směrem, aby člověk rozlišil ty oktávy, kdy na těch klávesách jich může být až 8. A teď tam dolů dávat ruce a jestli k těm rukám dávat ty čísla, který se pak objevují nahoře nebo ne.

To všechno prostě do toho zanáší strašně moc vizuálního odpadu, který to zanáší a pak je pro lidi složitější se v tom vyznat. Dost se mi hodilo, že jsem 6 let hrál na piano, takže jsem úplně netápal.

Myslím, že je vidět, že jsme si to dost užívali. Tu práci tady na tom. A že to šlo celkem hladce. A mě hrozně bavilo to posouvat ještě dál a dál. A pak, když jsme tomu dodávali drobné záře a věci, které už jsou jen detaily a posouvají to dál, tak to byla jedna velká radost.

Vzpomínáš si, Radime, na nějaký moment, který se ti z toho líbil, nebo kde jsi viděl nějaký zádrhel?

Já myslím, že ten zádrhel nás teprve čeká. A to bude první user testing na trzích, kterým vůbec nerozumíme. Já jsem teď byl na US Select Summitu ve Washingtonu, kde jsem se bavil s lidmi z celého světa. Hodně jsem se bavil s lidmi z Jihovýchodní Asie, protože si uvědomujeme, že tam konkrétně piano je extrémně populární nástroj. A tahle aplikace se jim strašně líbila, když jsem o tom mluvil a ukazoval jsem jim to.

Myslím si, že ta hlavní výzva bude v tom, že až tu aplikaci spustíme, tak, že si ji bude moct otevřít člověk z Hongkongu a bude tomu rozumět a reálně ho to něco naučí a bude to chápat. A stejně tak si to otevře člověk ze San Francisco anebo z Ugandy. To bude ta hlavní výzva. Udělat to tak dobře, že to pochopí lidi z různých kultur a budou se podle toho schopni učit. To myslím, že bude výzva, která nás čeká, ale těším se na to.

Na to jsem se chtěl zeptat. Vzhledem k povaze té aplikace, je asi těžké dělat testování použitelnosti na nějakém ranném konceptu — jak to těm lidem ovládá a jak tomu rozumí. Takže to je teď další krok, který máte naplánovaný? Nebo už jste dokázali to nějakým způsobem to otestovat? To asi nebylo moc možné, ne?

Já jsem to testoval tak, že jsem s sebou měl to dětské pianko a když byla příležitost, tak jsem ho vytáhl a ukazoval jsem to lidem a oni to všechno pochopili. Akorát je trošku něco jiného, když to prezentuji já a ukazuji, jak to funguje, než když si to stáhne někdo, kdo v životě neslyšel o ArtMasteru a zjistí, že je tady nějaká aplikace, která dokáže konečně naučit zahrát si písničku opravdu rychle.

Já si ani nedokážu představit, co to pro nás bude znamenat, jak moc budeme muset sbírat data a zjišťovat, jak moc to lidem jde nebo nejde. Stejně jako to děláme teď v ArtMasteru, kde hodně komunikujeme s našimi uživateli a zjišťujeme, co se jim líbí, co se jim nelíbí, co jim funguje, nefunguje, co jsme mohli udělat lépe. A myslím si, že to budeme muset dělat úplně stejným způsobem, až to reálně spustíme.

V těch designových procesech je často taková mantra, že se má testovat co nejdřív a co nejranější prototypy, ale to v tomhle případě vlastně nejde. Ty potřebuješ, aby si to ten člověk zažil pořádně, aby si fakt testoval reálný zážitek. Tak jsem zvědavý, jak se tohle to posune. Chystáte i nějaké testovací sezení?

Já už mám první verzi. Jenom doupravíme pár malých detailů a můžeme to začít testovat. Můžeme to lidem dát, můžeme říct: zkus s tím něco udělat a uvidíme. Jedna věc je, že je těžké předpokládat, co ten člověk začne dělat. Co když začne mačkat všechny klávesy najednou, nebo co když nezahraje vůbec nic? Těch možností, co člověk může interagovat, je strašně moc. Takže jsem sám zvědavý, jestli pochopí, co mají dělat a jestli jim to pomůže. To nás teď čeká.

AI interfaces a různí asistenti, to je dost nová disciplína, vzhledem k tomu, jak v poslední době jejich technologické schopnosti poskočily řádově někam jinam.

Lukšo, ty jsi říkal, že sis koupil tři knížky, které jsi si načetl, než si se do toho pustil. Bylo tam nějaké téma, které tě zaujalo nebo bylo náročné do toho proniknout? A pak by mě samozřejmě zajímalo, jestli doporučíš nějakou z těch knížek pro lidi, kteří to třeba řeší.

Rozhodně doporučuji Eriku Hall a její knihu Conversational Design.

Co myslím, že je docela náročné a obzvlášť při audio konverzacích je, že nevidíš text a nemůžeš interagovat kurzorem. Takže je musíš limitovat počtem voleb, který lidem nabízíš. To je jedna věc.

A druhá věc je volba jazyka. Myslím, že hodně brandů, který se tímhle zabývají, tak se strašně snaží dostat do toho bota — v našem případě Artiemu propůjčil hlas veleznámý pianista, youtuber a edukátor David Bennett.

Takže se do toho hodně snaží dostávat nějaké hodnoty značky, a přitom je strašně důležité to, aby ten jazyk byl co nejkratší a nevyvolával v lidech nějaké negativní pocity. Aby mu třeba neříkal, že něco dělá špatně. To tam nikdy nesmí zaznít takovéhle věci. A je potřeba volit nějakou míru skutečnosti. To jsme taky zvažovali, že by to byl přímo David. Že by tam byl jeho obličej a že by se mu tam hýbala pusa.

Takže pro člověka, který byl celý život obrazovkovým designerem, tak je to docela nová, zajímavá výzva.

To mi přijde v pořádku, že z pohledu designu je důležité koukat na to přes ty lidi, kteří to budou používat, víc než přes ty technologie. Najít nejdřív ten case a pak teprve tu technologii než naopak. Tak tady se mi líbilo Radime, jak jsi vyprávěl o tom příběhu, který zatím stojí. Ta potřeba je jasná — najít tu linku mezi tím, že máš personalizovanou výuku, ale zároveň nemusíš někam osobně dojíždět a nemusí to být tak drahý díky té technologii.

Blížíme se do finále, tak mě by zajímalo Radime, jaký máte teď plány?

Velký, samozřejmě. Pro nás jsou pořád hlavní byznys naše videokurzy na Artmaster.com, kde se snažíme stále obohacovat ten obsah a najít další nejlepší učitele na světě.

Zrovna včera měl call s člověkem, kterým se jmenuje Printz Board, což je jeden z music directorů The Black Eyed Peas, který složil třeba písničku Where is the love? Ta má přes miliardu poslechů na YouTube i na Spotify. Zároveň to je i učitel hudby, který například přednášel na konzervatoři v Amsterdamu, v Austrálii nebo na Novém Zélandě a k tomu všemu spolupracoval s Katy Perry a s dalšími velkými jmény a on je hlavně producent a songwriter. A my zrovna teď hledáme toho nejlepšího učitele na songwriting, aby pomohl začátečníkům složit si svoji první písničku. Takže jsem s ním měl včera call a byl velmi nadšený a plánujeme s ním rovnou na srpen natáčení kurzu.

Zároveň k tomu chceme dál vyvíjet AI učitele, kterého integrujeme do té naší vzdělávací platformy. Zatím to bude teda pro piano, ale kdo ví, kam se pak posuneme v budoucnu a k jakým dalším nástrojům. A taky chceme vyvíjet další tooly a nástroje, které budou pomáhat našim žákům, aby se co nejrychleji naučili zahrát nebo zazpívat svoji první písničku.

Nově máme na Artmaster.com free trial na 7 dní, takže pokud by to někoho zajímalo, může si zkusit jakýkoliv z kurzů. Může si vyzkoušet zpívání se zpěvačkou, která byla na celosvětovém turné s Britney Spears nebo Justinem Timberlakem. Nebo se naučit složitější akordy na kytaru s kytaristkou, která hrála s Dua Lipou. Takže budu rád, když si to kdokoliv vyzkouší. Budu samozřejmě rád i za feedback, který sbíráme od každého, kdo si to vyzkouší a naším plánem teď je hlavně růst v Americe a v západní Evropě a pak bychom se postupně chtěli dostat i na další trhy.

Hodně zajímavý je pro nás ten jihovýchodní trh, kde si myslím, že je velký potenciál právě té aplikace pro piano, což je Artie. Věříme, že tam bude populární a když se nám tam podaří uspět, tak myslím, že to bude hodně zajímavý trh, kde to můžeme dál rozvíjet.

A co se týká Artie. Kdy myslíš, že bude k dispozici na vyzkoušení pro zákazníky?

Doufám, že před koncem roku bychom mohli mít nějakou verzi, která tě naučí zahrát aspoň nějaké písničky a bude umět rozpoznat, co děláš za chybu.

Na základě té chyby ti vygeneruje cvičení, které ti pomůže odstranit tu chybu. A v podstatě cílem bude, aby ses naučil zahrát si svou oblíbenou písničku co nejrychleji.

My si uvědomujeme, že spousta lidí a spousta rodin má doma piána nebo klávesy, které jenom sbírají prach. A věříme, že když lidem nabídneme ze začátku tu aplikaci zdarma, tak by si to mohli zkusit a třeba si k tomu znovu najdou cestu a začnou hrát na piano.

Super, tak na to se těším.

Lukšo, jaké máš ty plány z hlediska designu konverzačních interfaces? A jak vlastně vidíš budoucnost designu takhle s AI?

Já to budu mít asi hodně citově zabarvené, protože já jsem s AI nadšený a jakýkoliv takový projekt, na kterém můžu dělat a něco si tam zkoušet, tak mě strašně baví. A jsem za to hrozně vděčný. V mnoha případech, hlavně v případě nějakého generativního AI, to znamená jít mimo komfortní zónu a vůbec nějakou technologii dneska zprovoznit je docela náročný.

Věci jako Stable Diffusion a rozhraní jako ComfyUI by se daly přirovnat jako takové kontrolování náhodnosti. Ten potenciál je myslím obrovský. A to je to, co mě na tom strašně láká je — jak to všechno změní. Cítím se stejně jako v roce 1993, kdy jsem jezdil autobusem z Karlových varů do Brna na internet a vezl jsem si v kapse papírek, na kterým bylo napsáno Yahoo.com. Vystál jsem tam dlouhou frontu, abych se dostal k počítači, pak jsem tam to Yahoo.com napsal a byl jsem hrozně šťastný. Už jsem teda nevěděl, na co dál kliknout, ale byl jsem nadšený. A stejně nadšený jsem teď do všech věcí, které se tykají téhle nové úžasné doby.

Já myslím, že to byl parádní závěr toho našeho vyprávění. Kluci, děkuji, že jste si udělali čas, že jste nasdíleli to na čem makáte. Tak díky a doufám, že si to třeba zase za nějakou dobu zopakujeme a podíváme se na nějaké další výzvy, které jste po cestě potkali.

--

--

2FRESH

Pomáháme produktovým týmům s designem. Pomáháme designerům růst a mít pestrou práci.