Veritone velas izveidot dzilu viltojumu, lai klonetu jusu balsi

Veritone velas izveidot dzilu viltojumu, lai klonetu jusu balsi

Reperu sarunas

Ir video, kas periodiski parādās manā YouTube plūsmā. Tas ir saruna starp reperiem Snoop Dogg un 50 Cent, kur viņi sūdzas par to, ka, salīdzinot ar viņu paaudzi, visi mūsdienu hip-hop mākslinieki šķiet vienādi. “Kad cilvēks izlemj būt pats sev, viņš piedāvā kaut ko tādu, ko neviens cits nevar būt,” saka 50 Cent. “Jā, jo tiklīdz tu esi tu – kas var būt tu, izņemot tevi?” atbild Snoop.

Kad video tika augšupielādēts 2014. gada oktobrī, tas varēja būt plaši patiesi. Bet dažus gadus vēlāk tas noteikti nav tā. Pasaulē, kurā pastāv audio deepfake tehnoloģijas, ir iespējams apmācīt mākslīgo intelektu izklausīties biedējoši līdzīgi citai personai, barojot to ar audio korpusu, kas sastāv no stundām ilgiem viņu runas datiem. Rezultāti ir nepatīkami precīzi.

Publiskas personas, piemēram, reperis Jay-Z un psihologs Džordans Pītersons, jau ir sūdzējušies par cilvēkiem, kas nelikumīgi izmanto viņu balsis, radot audio deepfake un pēc tam liekot viņiem teikt muļķīgas lietas internetā. “Pamosties,” rakstīja Pītersons. “Tava balss un tavs tēls ir nopietnā riskā.” Tie ir tikai ļaunprātīgi gadījumi. Citos rezultāti var pārvērsties nenoteiktā noziedzībā. 2019. gada incidentā, noziedznieki izmantoja audio deepfake, lai imitētu enerģētikas uzņēmuma vadītāja balss un pārliecinātu pakļautību pa tālruni steidzami pārskaitīt 243 000 dolārus uz bankas kontu.

Veritone, mākslīgā intelekta uzņēmums, kas izveidojis viedus rīkus mediju marķēšanai izklaides industrijai, atdod audio deepfake varu atpakaļ tiem, kam tā patiesi pieder. Šajā mēnesī uzņēmums paziņoja par Marvel.ai, ko uzņēmuma prezidents Raiens Stīlbergs aprakstīja kā “pilnīgu balss kā pakalpojuma risinājumu”. Par maksu Veritone izveidos mākslīgā intelekta modeli, kas izklausīsies tieši kā jūs (vai, iespējams, slavena persona ar uzreiz atpazīstamu balsi), ko pēc tam var iznomāt kā augsto tehnoloģiju versiju Arielas balss kā ķīla no Mazās nāriņas.

“Tava balss ir tikpat vērtīga kā jebkurš cits satura vai zīmola atribūts, kas tev ir,” teica Stīlbergs. “[Tas ir līmenī ar] tavu vārdu un līdzību, tavu seju, tavu parakstu vai dziesmu, ko esi uzrakstījis vai satura gabalu, ko esi radījis.”

“Mēs varam pārstrukturēt daudz”

Daži indivīdi protams jau sen pārdod savas balsis, ierakstot reklāmas vai paziņojumus, dziedot dziesmas un neskaitāmas citas monetizēšanas formas. Bet šie centieni visi prasīja personai patiešām pateikt vārdus. Ko Veritone risinājums sola darīt ir padarīt to individuāli skalējamu.

Ko darīt, piemēram, ja Kevins Harts varētu licencēt savu balsi luksusa zīmolam, kas to varētu izmantot personalizētu reklāmu radīšanai ar skatītāja vārdu, tuvākās mūra un javas pārdošanas vietas atrašanās vietu un konkrēto produktu, ko viņš visdrīzāk varētu iegādāties? Nevis pavadot burtiski dienas ierakstu kabīnē, mākslīgais intelekts varētu ļaut to izdarīt ar mazliet vairāk (Harta daļai vismaz) nekā parakstot punktiņaino līniju, lai piekristu savas balss līdzinieka izmantošanai minētajai trešajai pusei. Kamēr viņš filmē filmu, dodas komēdijas turnejā, atpūšas vai pat guļ, viņa digitālā balss varētu iegūt naudu.

“Mēs varam pārstrukturēt daudz,” skaidroja Stīlbergs par apmācības procesu. “Cilvēki, kas jau runā daudz, ja viņi veido podkastu vai ir plašsaziņas līdzekļos, tur ir daudz datu. Mums jau var būt daudz datu, ja viņi nejauši ir mūsu klients.”

“Ko mēs atrodam tik aizraujošu par šo jauno A.I. kategoriju ir tā paplašinamība un mainīgums.”

Stīlbergs teica, ka balss kā pakalpojuma ideja Veritone radusies jau pirms vairākiem gadiem. Tomēr tajā laikā viņš nebija pārliecināts, ka mašīnmācīšanās modeļi spēj radīt hiperrelistiskas sintētiskas balsis, ko viņš meklēja. Tas ir īpaši svarīgi attiecībā uz balsīm, ko mēs zinam intīmi, pat ja nekad patiesi neesam satikuši runātāju. Rezultāti var būt kaut kas līdzvērtīgs dzirdamajam uncanny valley, ar katru nepareizu skaņu brīdinot klausītajus par to, ka viņi klausās viltus. Bet šeit 2021. gadā viņš ir pārliecināts, ka lietas ir attīstījušas līdz punktam, kur tas tagad ir iespējams. Tādēļ Marvel.ai.

Stilbergs runa aizrautīgi par tehnoloģijas milzīgo potenciālu, uzsverot tās iespējamo “izpildes modalitāšu” daudzveidību. Veritone var izveidot modeļus teksta uz runas paziņojumiem. Tas var arī izveidot modeļus runas uz runas paziņojumiem, kur balss aktieris var “vadīt” vokālo sniegumu, lasot vārdus ar piemērotu intonāciju un pēc tam uzliekot gala balss rezultātu kā Snapchat filtru. Uzņēmums var arī atstampa katru balsi tā, lai tas var noteikt vai kaut kura šķietami reāla audio daļa kas parādijusies kaut kur tika radīta izmantojot tā tehnoloģiju.

“Jo vairak tu doma par to… tu patiesi vari iedomaties 50 citus [iespejamos lietojumus],” viņš teica. “Ko mēs atrodam tik aizraujošu par šo jauno A.I. kategoriju ir tā paplašinamība un mainigums.”

Apsveriet citus piemerus. Slavens sportists var būt dievs basketbola laukumā, bet velns lasot rindkopas skriptos dabiski. Izmantojot Veritone tehnoloģiju, viņu daliba videospelu ainavas vai audio gramatniecibas lasijumos (ko vini ari nebut nav rakstijusi) var tikt veikta ar balss aktieriem un tad digitali pielagota lai izklausitos pec sportista. Vel viena iespejamiba ir filma ko var tulkot citam valodam ar to pasu aktiera balsi tagad lasot rindkopas franciski mandariniski vai jebkura cita no daudzam valodam pat ja aktieris tos neparvalda.

Ka sabiedriba reages?

Lielais jautajums kas virs visa sava karajas protams ir ka sabiedriba reages uz visu to. Tas ir sarežgiti neparedzami. Slavenibam sodien jabut gan lielakam-par-dzivi figurai kam ir verts likt sejas uz reklamas stendiem gan ari sakarigiem individiem kam ir attiecibu problemes tvitero par televizoru skatisanos pidzamas un dari smiekligas sejas kad ed karsto merciti.

Ko darit tad kad paradas reklamas kas ne tikai ietver slavenibu lasot rindkopas bet ari gadijumos kad mes zinam ka minetais izpilditajs nekad patiesi nav teicis tas rindkopas bet gan programmiski izmantots lai mus vestitu merktiecigu reklamu? Stilbergs teica ka tas nav daudz atskirigs no slavenibas kas nodod kontroli par savu socialo mediju kontiem tresajai pusei konta menedzerim. Ja mes redzam Teiloru Sviftu tvitero mes zinam ka tas pilnigi iespejams nav Teilore pati kas sit zinojumu it ipasi ja tas ir apstiprinajums vai reklamas saturs.

Bet balss ir patiesa veida atskiriga precizi tapec ka tas ir personalakais. It ipasi ja tas ir apvienots ar personalizacijas pakapi kas ir viens no lietojuma gadijumiem kas visvairak izjutams. Patiesiba ir ta ka citots no scenarista Viljama Goldmana neviens nezina ka sabiedriba reages – precizi tapec ka neviens nav darijis tiesi so ieprieks.

“Tas bus spektra skrejiens pareizi?” Stilbergs teica. “[Dazi] cilveki teiks ‘Es gribu izmantot so riku nedaudz lai papildinatu manu dienu lai man palidzetu ietaupit laiku.’ Citi teiks pilnigi ‘Es gribu manu balsi visur lai paplasinatu manu zimolu un es gribu to licencet.'”

Vina labaka minejuma pieņemsana bus katras lietas pamata. “Jums jabut saskanota ar jusu auditorijas reakciju un ja jus redzat ka lietas strada vai nestrada,” vinš teica. “Vini var milet to. Vini var teikt ‘Zinat ko? Es milestu faktu ka jus izplatat 10 reizes vairak satura vai vairak personala satura man pat ja es zinu ka jus izmantojat sintetisko saturu lai to papildinatu. Paldies. Paldies.'”

Domajiet par nakotni

Un nakotne? Stilbergs teica ka “Mes gribam stradat ar visam lielakajam talantu agenturam. Mes domajam ka ikviens kas ir biznesa lai pelnitu naudu ap retu zimolu jabut domajosiem par savu balss strategiju.”

Un negaidiet ka tas paliks tikai par audio ari. “Mes vienmer esam bijusi aizravusi ar sintetiska satura potencialu izmantosanai lai paplasinatu papildinatu vai potenciali pilnigi aizstatu dazus no mantojuma satura radisanas veidiem,” vinš turpinaja. “Gan audio gan galarezultata video izpratne.”

Tieši ta: Kad tas bus nostiprinajis tirgu audio deepfake pasaule Veritone planos solit talak un ieiet pilnigi realizetu virtualo avataru pasaule kuri gan skan gan izskatas neatskirami no savas avota.

Pekšni tie personalizetie sludinajumi no Minority Report skan daudz mazak ka zinatnes fantastika.