Vsakdo, ki je poskusil Google Photos, se strinja, da je ta brezplačna Googlova storitev za shranjevanje fotografij in upravljanje pametna. Vsebuje različne pametne funkcije, kot so napredno iskanje, zmožnost kategorizacije slik po lokacijah in datumih, samodejno ustvarjanje albumov in videoposnetkov na podlagi podobnosti ter vas popelje po pasu spomina, tako da vam pred nekaj leti prikaže fotografije istega dne. Obstaja veliko stvari, ki jih Google Photos lahko naredi, da bi bilo pred nekaj leti strojno nemogoče. Google Photos je ena od mnogih »pametnih« storitev Googla, ki uporablja tehnologijo strojnega učenja, imenovano TensorFlow. Beseda učenje kaže, da bo tehnologija s časom postala pametnejša do te mere, da si naše sedanje znanje ne more predstavljati. Toda kaj je TensorFlow? Kako se lahko stroj nauči? Kaj lahko storite z njim? Pa ugotovimo.
Kaj je TensorFlow?
TensorFlow je Googlov odprtokodni in zmogljiv program za umetno inteligenco, ki pooblasti številne storitve in pobude Googla. Gre za drugo generacijo sistema za obsežne implementacije strojnega učenja, ki ga je zgradila ekipa Google Brain. Ta knjižnica algoritmov uspe DistBelief - prva generacija.
Tehnologija predstavlja računanje kot grafikone pretoka podatkov o stanju. Kar je TensorFlow edinstveno, je njegova sposobnost modeliranja izračunov na širokem razponu strojne opreme, od mobilnih naprav na ravni potrošnikov do strežnikov z več GPU svetovnega razreda. Lahko deluje na različnih grafičnih procesorjih in procesorjih in obljublja razširljivost strojnega učenja med različnimi napravami in pripomočki, ne da bi bilo treba spreminjati veliko količino kode.
TensorFlow izvira iz Googlove potrebe po poučevanju računalniškega sistema, da posnema, kako človeški možgani delajo pri učenju in razmišljanju. Sistem, znan kot nevronske mreže, bi moral biti sposoben izvajati večdimenzionalne podatkovne nize, imenovane »tenzorje«. Končni cilj je usposobiti nevronske mreže za zaznavanje in dešifriranje vzorcev in korelacij.
Novembra 2015 je Google tehnologijo odprtokodne tehnologije omogočil, da jo je sprejela v vse vrste izdelkov in raziskav. Vsakdo, vključno z raziskovalci, inženirji in ljubiteljskimi delavci, lahko pomaga pri pospeševanju rasti strojnega učenja in ga prenese na višjo raven v krajšem času.
Ta poteza se je izkazala kot prava, ker je veliko prispevkov neodvisnih razvijalcev pri TensorFlowu, da daleč presegajo Googlove prispevke. Wikipedija omenja, da "na GitHubu obstaja 1500 skladišč, ki omenjajo TensorFlow, od tega 5 iz Googla." Ob tem je ena od razprav v Quori sumila, da je izdana odprta koda "očiščena" različica. ki jih Google uporablja v svojih storitvah.
Kako deluje TenserFlow?
Z uporabo preprostega normalnega človeškega jezika in težke poenostavitve lahko vidimo eno stran TensorFlowa kot napredne avtonomne tehnologije filtriranja. V svojem srcu je tehnologija ogromna programska knjižnica strojnega učenja. Uporablja bazo podatkov, da ji pomaga „odločati“.
Nekdo na primer prenese fotografijo v Google Foto. Tehnologija bo primerjala vse podrobnosti slike s svojo bazo podatkov in se odločila, ali gre za sliko živali ali človeka. Potem, če je človek, bo poskušal določiti spol, starost do celotne poti do osebe, ki je. Enak postopek se ponovi za druge predmete na fotografiji.
Uporabnikove podatke, kot so identiteta osebe na sliki in lokacijo, kjer se slika posname, uporablja tudi za izboljšanje knjižnice, tako da lahko v prihodnosti daje boljše rezultate - tako za posameznika, ki je naložil fotografijo, kot za vse drugače. Zato je izraz »učenje«. Vendar se ne ustavi le na poznavanju in učenju podatkov iz fotografij. Tehnologija lahko z informacijami na fotografiji stori toliko. Na primer, lahko združuje fotografije s podobnimi podatki, kot je ista oseba, ista lokacija, isti datum; si oglejte vzorec obrazov, da ugotovite, kateri družini in prijateljem pripada oseba na fotografiji, in uporabite informacije za ustvarjanje videoposnetkov družinskih počitnic ali animacije iz neprekinjenih posnetkov.
To komaj opraska površino, kako deluje TensorFlow, vendar upam, da vam lahko ponudi splošno sliko tehnologije. Tudi z uporabo samo enega primera ne moremo storiti pravičnega za to, kar je sposobno.
In za vse navdušence Artificial Intelligence, ki so tam zunaj, je vredno omeniti, da je Google že ustvaril tehnologijo računalniškega čipa, optimizirano za strojno učenje in vključevanje TensorFlow v to. To se imenuje Tensor procesne enote (TPU) čip ASIC .
Tisti, ki želijo izvedeti več o TensorFlowu, lahko obiščejo njegovo spletno stran.
Aplikacije TensorFlow
Smo na začetni stopnji tehnologije strojnega učenja, tako da nihče ne ve, kje nas bo popeljal. Vendar pa je nekaj začetnih aplikacij, ki nam lahko pokažejo prihodnost. Ker izvira iz Googla, je očitno, da Google tehnologijo uporablja za številne storitve.
Več o analizi slike
Obravnavali smo primer uporabe tehnologije za analizo slik v storitvi Google Foto. Toda aplikacija za analizo slike se uporablja tudi v funkciji Pogleda ulic v Google Zemljevidih. TensorFlow se na primer uporablja za povezavo slike s koordinatami na zemljevidu in samodejno zameglitev registrske številke avtomobila, ki je po nesreči vključen v sliko.
Prepoznavanje govora
Google uporablja tudi programsko opremo TensorFlow za prepoznavanje govora. Tehnologija, ki uporabnikom omogoča, da izgovarjajo navodila, ni nova, toda vključitev vse večje knjižnice TensorFlow v mešanico lahko poveča funkcijo nekaj zarez. Tehnologija za prepoznavanje govora trenutno prepozna več kot 80 jezikov in različic.
Dinamični prevod
Še en primer "učenja" dela tehnologije strojnega učenja je Googlova funkcija prevajanja. Google svojim uporabnikom omogoča dodajanje novih besedil in odpravljanje napak v storitvi Google Prevajalnik. Vedno večji podatki se lahko uporabijo za samodejno zaznavanje jezika vnosa, ki ga želijo prevesti drugi uporabniki. Če naprava napravi napake pri postopku zaznavanja jezika, jih lahko uporabniki popravijo. In stroj se bo na teh napakah naučil izboljšati svoje prihodnje rezultate. In cikel se nadaljuje.
Alpha Go
Zabaven primer uporabe TensorFlowa je Alpha Go. To je aplikacija, ki je programirana za predvajanje Go . Za tiste, ki ne poznajo Goa, je to abstraktna družabna igra za dva igralca, ki izvira iz Kitajske pred več kot pet tisoč petsto leti, in je najstarejša igralna plošča, ki se še vedno igra danes. Medtem ko so pravila preprosta - za obkrožanje več ozemlja kot nasprotnika, je igra izjemno zapletena in po Wikipediji: "ima več možnosti kot skupno število atomov v vidnem vesolju."
Torej, zanimivo je, kaj lahko tehnologija strojnega učenja z neskončnimi možnostmi. V svojih tekmah proti Lee Sedolu - 18-časovnemu svetovnemu prvaku Go, je Alpha Go zmagal 4 od 5 tekem in prejel častno najvišje mesto Go grandmaster.
Magenta projekt
Še ena zanimiva aplikacija TensorFlow je Magenta projekt. To je ambiciozen projekt ustvarjanja strojno ustvarjene umetnosti . Eden od prvih oprijemljivih rezultatov eksperimenta je 90-sekundna klavirska melodija. Dolgoročno si Google želi s svojim projektom Magenta ustvariti naprednejšo strojno ustvarjeno umetnost in zgraditi skupnost umetnikov okoli nje.
Februarja 2016 je Google v San Fransiscou organiziral tudi umetniško razstavo in dražbo, ki je pokazala, da je računalnik ustvaril - z majhno pomočjo človeških umetnosti. Šest največjih del je bilo prodanih za 8.000 $. Računalnik bo še vedno lahko še zelo dolg, preden bo lahko posnemal pravega umetnika, toda količina denarja, ki so jo ljudje pripravljeni plačati za umetnost, nam pokaže, kako daleč je tehnologija odšla.
Podpora za iOS
Čeprav smo že videli zmogljivosti TenserFlow na Androidu, s svojo najnovejšo različico, TensorFlow končno dodaja podporo za iOS naprave. Ker je na voljo veliko odličnih mobilnih aplikacij, ki so na voljo izključno za iOS, ali pa so izdane prve na iOS-u, to pomeni, da lahko v bližnji prihodnosti pričakujemo več odličnih mobilnih aplikacij, ki sprejemajo strojno učenje. Enako lahko rečemo za možnosti širših posvojitev in aplikacij TensorFlow.
Prihodnost TensorFlow
Kaj lahko naredimo z napravo, ki se lahko nauči in sama sprejme svojo odločitev? Kot oseba, ki se ukvarja z več kot enim jezikom kot del vsakdanjega življenja, prva stvar, ki se mi pojavi, je jezikovni prevod. Ne v besedi na ravni besed, temveč v večji ravni besedila, kot so dokumenti ali celo knjige. Današnja tehnologija prevajanja je omejena na besednjake. Z lahkoto lahko ugotovite, kaj je "spanje" v kitajščini in obratno, vendar poskusite v enem samem poglavju Musajija Eiji Yoshikawa v svojem izvirnem japonščini prevesti poglavje v angleščino. Videli boste, na kaj se spopadam.
Prav tako je zabavno videti, kaj lahko prihodnost umetne inteligence opravi z glasbo. Čeprav je še vedno zelo osnovna, lahko Appleova aplikacija Music Memo že samodejno spremlja bas in bobne. Spomnim se ene epizode televizijske oddaje SciFi, kjer je lik v predstavi ustvaril napravo, ki analizira vse vrhunske pesmi v grafikonih in je sposobna napisati lastne hitove pesmi. Ali bomo kdaj prispeli tja?
In kot zaključna misel, bi rad omenil Sunspring . Gre za kratek znanstvenofantastični film, ki ga je v celoti napisal scenarist AI, ki se je imenoval Benjamin - ki je celo sestavil pop glasbo. Film je pripravil režiser Oscar Sharp za 48-urni filmski izziv za Sci-Fi London.
Zdaj ne morem nehati razmišljati o Terminatorju. Dobrodošli v prihodnosti.
Zasluge za slike: Wikipedia, TechInsider, The Verge, Wall Street Journal