Voivatko nestem?iset hermoverkot mullistaa teko?lyn maailmaa?

Avoin toiminta
Tiivistelm?

Teko?lyn maailmassa nestem?iset hermoverkot erottuvat t?rke?n? ja selke?n? tekij?n? niiden ihmisaivojen kaltaisen, ep?lineaarisen ja luovan l?hestymistavan ansiosta. T?m? on p?invastainen l?hestymistapa, kuin mist? lineaariset hermoverkot tunnetaan. Nestem?iset hermoverkot tunnetaan erityisesti siit?, ett? ne selviytyv?t erinomaisesti monimutkaisista haasteista, kuten s??ennusteiden tarkasta m??ritt?misest?, osakemarkkinoiden analysoinnista ja puheentunnistuksen eri alueista, joita aiemmin hallitsivat ihmisasiantuntijat.

Edell? mainituista kyvyist??n johtuen, nestem?iset hermoverkot ovat yksi t?rkeimpi? ja mielenkiintoisimpia nousevia komponentteja teko?lyn, eli Artificial Intelligence (AI) alalla.

Kun koneen tai robotin on reagoitava ulkoisiin ?rsykkeisiin tai tietoihin, t?m? toiminto voi olla eritt?in kuluttavaa erilaisten resurssien saralla, mik? taas voi aiheuttaa pullonkaulan, jos teko?ly? yritet??n sovittaa liian pieneen tilaan.

VentureBeat on kuvannut, kuinka perinteinen hermoverkko saattaa tarvita 100 000 keinotekoista neuronia pit??kseen auton vakaana esimerkiksi tietynlaisen ajotestin aikana, kuten ajoneuvon ajamisessa tietyn tieosuuden l?pi turvallisesti.

Mutta kun samaan teht?v??n sovellettiin nestem?isi? hermoverkkoja, l?yd?kset olivat uskomattomia. MIT CSAILin nestem?isi? hermoverkkoja kehitt?v? tiimi pystyi suorittamaan saman teht?v?n vain 19 neuronilla.

Nestem?iset hermoverkot – inspiraatio niiden takana

Nestem?iset hermoverkot ovat er??nlainen syv?oppimista harjoittava arkkitehtuuri.

  1. Se on ennen kaikkea kehitetty auttamaan erilaisia teht?vi? suorittavia robotteja ratkaisemaan monimutkaisia haasteita, helpottamaan niiden oppimista ja teht?v?nratkaisukyky?.
  2. T?m?n teknologian tavoitteena on v?ltt?? riippuvuus pilvipalveluista tai rajoitetusta sis?isest? tallennustilasta.

MIT CSAILin johtaja Daniela Rus kertoi tutkimuksistaan seuraavaa VentureBeatille: “Nestem?isten hermoverkkojen inspiraationa oli ajatella olemassa olevia koneoppimisen l?hestymistapoja ja pohtia, kuinka ne sopivat sellaisiin turvallisuuskriittisiin j?rjestelmiin, joita robotit ja reunalaitteet tarjoavat.”

H?n jatkoi: “Robotilla ei todellakaan voi ajaa suurta kielimallia, koska niiss? ei ole paljoa laskentatilaa [tehoa] ja [tallennustilaa].”

Tutkimusryhm? k?ytti nestem?isten hermoverkkojen kehityksess? hyv?ksi my?s pienten organismien biologisten hermosolujen tutkimuksesta saatavaa tietoa.

Mit? ovat keinotekoiset hermoverkot?

K?yd??n seuraavaksi l?pi t?ss? artikkelissa tarvittavat perusk?sitteet, jotta voimme ymm?rt?? keinotekoisten ja nestem?isten hermoverkkojen erot.

  • Keinotekoinen hermoverkko on teknologia, joka toimii ihmisaivojen toimintaa vastaavalla tavalla.
  • P??asiassa keinotekoinen hermoverkko simuloi jollain tavalla aivojen biologisten neuronien toimintaa ja rakentamista.
  • Neuraaliverkkoja rakennetaan monin eri tavoin, laskettuina malleina, joilla toteutetaan esimerkiksi erilaisia koneoppimisprojekteja.
  • Niiss? tietokoneita voidaan kouluttaa “ajattelemaan” omalla tavallaan ja itsen?isesti (ChatGPT).

Sen perusteella, mit? tied?mme ihmisaivoista, sek? sen perusteella, miten voimme jo hy?dynt?? huipputeknologioita, voimme edisty? sen selvitt?misess?, kuinka tietokone saadaan “toimimaan kuin aivot”. T?m? ei kuitenkaan tarkoita sit?, ett? insin??rit toistaisivat ihmisen kognitiivista k?ytt?ytymist?. Ihmisen aivot ovat musta laatikko, jota emme viel?k??n t?ysin ymm?rr?.

Jossakin mieless? hermoverkot ovat outo hybridi “tekemisest?” ja “olemisesta”. Ne toimivat paljolti aivojen hermosolujen kerrosten tavoin. Mutta ero on siin?, ett? keinotekoiset hermoverkot toimivat silti valtavan harjoitusdatan perusteella, joten ne ovat lopulta vain puoli?lykk?it?, ainakin omiin ihmisaivoihimme verrattuna.

Mit? ovat nestem?iset hermoverkot?

Nyt kun tied?mme mit? keinotekoiset hermoverkot ovat, joten verrataan t?t? tietoa seuraavaksi siihen, mit? nestem?iset hermoverkot ovat. Nestem?isi? hermoverkkoja voidaan ajatella ihmisaivojen toisiinsa liittyvin? soluina, jotka yhdistyv?t k?sittelem??n tietoa ja tuottamaan tulosta.

Ihmisen aivot ovat eritt?in monimutkainen soluj?rjestelm?, joka suorittaa hyvin monimutkaisia laskelmia. Nestem?iset hermoverkot taas keskittyv?t turvallisuuden kannalta kriittisiin sovelluksiin, kuten itseohjautuviin ajoneuvoihin ja robotteihin, jotka tarvitsevat jatkuvan datavirran sy?tt?mist? niihin.

Daniela Rusin mukaan “Nestem?isill? hermoverkoilla menee yleens? hyvin, kun meill? on aikasarjadataa… tarvitset sekvenssin, jotta nestem?iset verkot toimivat hyvin.”

“Jos yrit?t soveltaa nestem?ist? verkkoratkaisua johonkin staattiseen tietokantaan, kuten ImageNetiin, se ei kuitenkaan toimi niin hyvin”, h?n huomautti.

Mik? on teko?ly?

Jotta voimme ratkaista artikkelin otsikon kysymyksen, meid?n on my?s ymm?rrett?v? mik? teko?ly on.

?Teko?ly, eli Artificial Intelligence (AI), joka tunnetaan my?s nimell? kone?ly, on tietojenk?sittelytieteen ala, joka keskittyy rakentamaan ja hallitsemaan teknologiaa, joka voi oppia tekem??n p??t?ksi? ja suorittamaan toimia itsen?isesti ihmisen puolesta.

AI ei kuitenkaan ole yksitt?inen teknologia. Sen sijaan se on kattotermi, jonka alle mahtuu kaikentyyppisi? ohjelmistoja tai laitteistoja, jotka tukevat koneoppimista, asiantuntijaj?rjestelmi?, generatiivista teko?ly? ja tietyntyyppist? robotiikkaa.

Nykyp?iv?n teko?ly toimii p??asiassa perinteisill? CMOS-pohjaisilla laitteistoilla ja sis?lt?? sekoituksen perinteisi? algoritmeja ja dataohjattuja koneoppimismalleja.

Kun t?t? teknologiaa on sulautettu yh? enemm?n arkik?ytt??n, my?s nestem?iset hermoverkot ovat ker?nneet enemm?n kiinnostusta. Se on tutkimusalue, jolla pyrit??n j?ljittelem??n ihmisaivojen arkkitehtuuria suunnittelemalla erikoislaitteistoja ja algoritmeja, jotka on optimoitu alhaiseen virrankulutukseen ja reaaliaikaisuuteen.

Lue my?s: Voiko kvanttilaskenta vaikuttaa teko?lysovelluksiin?

Ero teko?lyn ja koneoppimisen v?lill?

Machine Learning (ML) on teko?lyn osajoukko, joka keskittyy sellaisten mallien rakentamiseen, joiden avulla tietokoneet voivat oppia erityyppisest? datasta. Sen sijaan, ett? ML-mallit olisi nimenomaisesti ohjelmoitu suorittamaan jokin teht?v?, ne k?ytt?v?t tietoja ennusteiden tai p??t?sten tekemiseen.

Pohjimmiltaan kaikki teko?ly on teko?ly?, mutta kaikki teko?ly ei k?yt? toimiakseen ML-tekniikoita. Esimerkiksi s??nt?pohjaiset asiantuntijaj?rjestelm?t ja symbolinen teko?ly kuuluvat teko?lyn sateenvarjon alle, mutta niihin ei v?ltt?m?tt? sis?lly tiedoista oppimista samalla tavalla kuin Machine Learningiin.

Nestem?iset hermoverkot – edut ja rajat

T?m? artikkelin alussa mainittu MIT:n Computer Science and Artificial Intelligence Laboratoryn (CSAIL) tutkimusryhm? on havainnut nestem?isi? hermoverkkoja kehitt?ess??n erityisesti seuraavanlaisia etuja.

Eiv?t vaadi paljoa tilaa

Nestem?iset hermoverkot voisivat toimia huomattavasti pienemm?ll? m??r?ll? neuroneja kuin perinteiset hermoverkot.

Kuten aiemmin t?ss? artikkelissa on kuvattu, perinteinen syv?oppiva hermoverkko tarvitsee noin 100 000 neuronia pit??kseen itse ajavan auton kaistalla – nestem?inen hermoverkko taas tarvitsee t?h?n teht?v??n vain 19 neuronia.

Syy-seuraus

Nestem?iset hermoverkot k?sittelev?t kausaalisuutta paremmin kuin perinteiset syv?oppivat hermoverkot. Ne voivat n?in ollen havaita selv?n syiden ja seurausten v?lisen yhteyden, jonka kanssa klassiset syv?oppivat hermoverkot kamppailevat.

Esimerkiksi klassiset syv?oppivat hermoverkot voivat jatkuvasti tunnistaa syy-seuraussuhteita tapahtumien v?lill? eri asetuksissa tehokkaammin kuin klassinen hermoverkko.

Tiedon tulkittavuus

Teko?lyj?rjestelm?n tarjoamien tietojen tulkinta ja ymm?rt?minen on yksi teko?lyn suurimmista haasteista. Klassisissa syv?oppimismalleissa on usein matala, ep?selv? tai v??r? perusta datan tulkinnoille, mutta nestem?iset hermoverkot voivat tarjota datan lis?ksi my?s perusteita tietojen tulkintaan.

Miinuspuolet

T?st? huolimatta ei voida ajatella, ett? nestem?iset hermoverkot olisivat kattava ratkaisu kaikkeen.

Vaikka ne k?sittelev?t tehokkaasti jatkuvia datavirtoja, kuten ??nivirtoja, l?mp?tilatietoja tai videovirtoja, ne kamppailevat staattisen tai kiinte?n datan kanssa. On kuitenkin olemassa useita muita teko?lymalleja, jotka sopivat n?ihin teht?viin paremmin.

Yhteenveto – Nestem?iset hermoverkot

Teko?lymaailmassa nestem?iset hermoverkot ovat joitain kaikkein mielenkiintoisimpia uusia malleja.

Ne toimivat rinnakkain klassisen syv?oppivan hermoverkon kanssa, mutta nestem?iset hermoverkot n?ytt?v?t sopivan paremmin eritt?in monimutkaisten teht?vien suorittamiseen, kuten autonomisiin ajoneuvoihin, l?mp?tilan tai ilmaston tulkitsemiseen tai osakemarkkinoiden analyyseihin. Klassinen syv?oppiva neuroverkko taas toimii paremmin staattisen tai aikatiedon tulkitsemisessa ja k?ytt?misess?.

MIT:n Computer Science and Artificial Intelligence Laboratoryn (CSAIL) tutkijat ovat yritt?neet laajentaa nestem?isten hermoverkkojen ominaisuuksia useampiin erilaisiin k?ytt?tapauksiin, mutta t?m? tulee viem??n aikaa.

Sek? nestem?isill? hermoverkoilla ett? klassisilla syv?oppivilla hermoverkoilla on m??ritellyt roolinsa laajemmassa teko?lykuvassa, ja t?m? on ehdottomasti tapaus, jossa kaksi eri mallia on enemm?n kuin yksi.

Aiheeseen liittyv?t artikkelit

Kaushik Pal
Technology Specialist
Kaushik Pal
Teknologia-kirjoittaja

Kaushik on tekninen arkkitehti ja ohjelmistokonsultti, jolla on yli 23 vuoden kokemus ohjelmistoanalyysista, kehityksest?, arkkitehtuurista, suunnittelusta, testauksesta ja koulutusalalta. H?nell? on kiinnostus uusiin teknologioihin ja innovaatioalueisiin. H?n keskittyy web-arkkitehtuuriin, verkkoteknologioihin, Java/J2EE:hen, avoimen l?hdekoodin ohjelmistoihin, WebRTC:hen, suuriin tietoihin ja semanttisiin teknologioihin. H?n on osoittanut asiantuntemuksensa vaatimusanalyysiss?, arkkitehtuurin suunnittelussa ja toteutuksessa, teknisten k?ytt?tapausten laatimisessa ja ohjelmistokehityksess?. H?nen kokemuksensa on kattanut eri toimialat, kuten vakuutus, pankki, lentoyhti?t, merenkulku, asiakirjahallinta ja tuotekehitys, jne. H?n on ty?skennellyt laajan valikoiman teknologioiden parissa aina suurten tietokonej?rjestelmien (IBM S/390), keskisuuren tason (AS/400), web-teknologioiden, avoimen l?hdekoodin ja suurten tietojen alueille. Kaushik on p??asiassa mukana Java/J2EE/avoimen l?hdekoodin/verkko/WebRTC/Hadoop- ja suurten tietojen…

',a='';if(l){t=t.replace('data-lazy-','');t=t.replace('loading="lazy"','');t=t.replace(/