GOOGLE'I TEHISINTELLEKT 'ALPHA GO ZERO' VAJUTAS LIHTSALT NUPPU LÄHTESTA, KUIDAS ÕPPIDA

Mäletate (ebamääraselt), kuidas õppisite kõndima, rääkima, rattaga sõitma või sõitma? See oli räpane ja täis vigu, kuid nii õpitud oskused jäid. Väljaspool elussüsteeme on olnud keeruline üles ehitada piisavalt tugevaid algoritme, et võtta kasutusele „reaalse elu kogemus” ja arendada tehisintellekti jaoks kleepuvat, kohanemisvõimelist käitumist.

Noh, Alpha Go Zero lihtsalt tegi seda.

'See algab tühjalt lehelt ja saab aru ainult iseendast, ainult enesemängust ja ilma igasuguste inimteadmisteta, inimandmeteta, tunnuste, näidete või inimeste sekkumiseta. See avastab, kuidas Go mängu mängida, esimestest põhimõtetest lähtuvalt, ”ütleb DeepMindi professor David Silver.

Tehisintellektil on olnud mitu kordust, millest igaüks on nutikam ja võimekam kui varem. Eelmises versioonis kasutati tohutut varasemate mängude andmebaasi koos hulga algoritmidega, mis suunasid selle võidu poole. Selline lähenemine viis valitseva maailmameistri profimängija Go kaotuse. Pokkeris nülgis AI Libratus hiljuti maailma tipptasemel pokkerimängijaid peaaegu 2 miljoni dollari võrra, õppides ka inimese mänguandmete asemel ise mängides.

kui pikk on dallon nädalat

Nüüd õpetas selles Alpha Go selles uusimas versioonis tehisintellekti programm ise kuidas Go-d mängida - ilma inimliku taustata.

Miljonite mängusimulatsioonide käivitamine enda vastu võttis 40 päeva, enne kui ta õppis - nullist -, kuidas võita enda maailmameistri versiooni. See muudab mängu tõeliselt mitte ainult Go jaoks, vaid ka uute teadmiste avastamiseks. Kui täpne või täielik on teie domeeni asjatundlikkus? Seal on palju rohkem, mida see põnev eksperiment Alpha Go Zero'ga õppimisel meile ütleb.

'Alpha Go idee ei ole minna välja ja võita inimesi, vaid tegelikult avastada, mida tähendab teaduse tegemine - selleks, et programm saaks ise õppida, mis on teadmine,' ütleb Silver oma YouTube'i postituses saavutus.

Alpha Go Zero Deep Mind meeskond nimetab seda esmapõhiseks õppimiseks (tabula rasa).

'Kui suudate saavutada tabula rasa õppimisel on teil agent, mida saab Go-mängust siirdada mis tahes muusse domeeni, ja selle mängu spetsiifika, kus olete, pakute välja nii üldise algoritmi, mida saab rakendada kõikjal, 'ütleb ta . See on provokatiivne idee, kui laiendate kontseptsiooni. Mõelge vaid sellele, mida saaksime teha tugevate õppimisalgoritmide komplektiga, mis suudaks süsteemselt lahendada karmid probleemid ja õppida kiiremini kui meie tsivilisatsiooni kollektiivsed teadmised. . . päevade, mitte aastakümnete jooksul.

kui palju on boomer esiason väärt

Praegu on suur äravõtmine see, et 'algoritmidel on palju rohkem kui arvutustel või saadaolevatel andmetel,' ütles Silver. Ainuüksi see on mängude muutja selles, kuidas me läheneme tuntud maailma laiendamisele. Kuigi Alpha Go kulutab umbes 25 miljonit dollarit riistvara - see pole just kerge süsteem -, teate, et tehisintellekti gurud on juba pikka aega töötanud puhtamate ja paremate andmekogumite loomisega. Tänapäeval peetakse paljusid suuri andmekogumeid tehisintellekti täpseks treenimiseks liiga lärmakaks - täis halbu andmeid. Kui tehisintellekt õpib andmetest ja andmed on halvad, siis nad ei õpi. Suur probleem.

Mis oleks, kui teil poleks vaja puhtaid andmeid, vaid lihtsalt kogemusi ja tehisintellekt saaks ennast koolitada?

See on põnev saavutus Alpha Go Zero. Ehkki see asub mängude niššide reeglipõhises maailmas, on sellel suuri tagajärgi kõigis tööstusharudes, mis töötavad füüsiliste reeglite järgi - mõelge keemia, liiklus, bioloogia, farmakoloogia, reisimine, logistika ja tootmine. Kui suudame reegleid nii paindlikult kujundada, et nad saaksid töötada laiema kogemuse põhjal ja nii suunatult, et loovad alati tugevama oskuse - nagu näiteks Alpha Go Zero -, on võimalik saavutada süsteemide kujundaja tehisintellekt. Need süsteemid ei vaja väliseid andmeid, neil pole probleeme andmete puhastamisega ega vaja inimese silmus pidurdamist. Osaliselt seepärast panustas Google'i emaettevõte Alphabet ettevõtte tehisintellekti peale ja investeerib tehisintellekti kiiresti. (Amazon investeerib ka tehisintellekti, nagu ka tema uusim tehisintellekti omandamine BodyLabs.)

dina Eastwoodi sünniaeg

Sügava meele professor David Silver ütleb: 'Asjaolu, et oleme näinud programmi saavutamas kõrgetasemelist jõudlust ... peaks tähendama, et nüüd saame hakata tegelema inimkonna kõige keerukamate ja mõjukamate probleemidega.'

Seda postitust on värskendatud, et selgitada, et AI Libratus võitis hiljuti pokkerimängijaid kasutades strateegiat, mis hõlmab pigem enda kui inimeste sisestatud andmeid.