Veikko Huuska

Voiko Google ennustaa sodan?

Voiko Google ennustaa sodan?

Sota verkossa – ilmentääkö googlatun sodan lisääntyminen jo tapahtuneen sodan lisääntymistä? - vai ennakoiko se tulevaa, vielä lisääntyvää sotaa?

Avainsanat: Google, Google-Trends, sota, war, frekvenssi, ennustaminen, "sitä on ilmassa"

*

Niin tai näin, sota on ilmassa.  Ilman muuta.

*

Tein aivan yksinkertaisen testin, miten monta kertaa sana ”sota” tai ”war” esiintyy Googlessa tämän vuosikymmenen vuosilukujen yhteydessä.

Tulokset:

Sana ”Sota” esiintymismäärät; Sana ”War” esiintymismäärät googlattaessa (sota/war AND 2010…2016)

Lähtökohtana ja eräänlaisena 0-tasona katsoin vuoden 2000 vasteet:

Vuosi 2000: sota 6,07 miljoonaa; war 17,6 miljoonaa

2010-luku tähän mennessä:

Vuosi 2010: sota 19,3 miljoonaa; war 53,7 miljoonaa

Vuosi 2011: sota 20,5 miljoonaa; war 61,4 miljoonaa

Vuosi 2012: sota21,1, miljoonaa; war 68,6 miljoonaa

Vuosi 2013: sota 22,7 miljoonaa; war 75,0 miljoonaa

Vuosi 2014: sota 24,5 miljoonaa; war 78,2 miljoonaa

Vuosi 2015: sota 26,9 miljoonaa; war 359,0 miljoonaa (!?)

Vuosi 2016: sota 27,3 miljoonaa; war 74,3 miljoonaa.

*

Sota nousee

Sota/War näyttää olevan tässä (simppel)indeksissä nousussa.  Tuo War AND 2015 on piikki, tai jokin ihme muuten.  Ken sen selittäisi.

Muutenkin tämä on täysin epätieteellinen indeksi; miten googlauksella saatava sanan esiintymistiheys, taajuus, vuosilukuun kytkettynä muodostuu? 

”Jonkin ilmiön taajuutta voidaan mitata määrittelemällä ensin jokin aikaväli ja tutkimalla sen jälkeen, kuinka monta kertaa kyseinen ilmiö toistuu tämän aikavälin aikana. Kun kertojen lukumäärä jaetaan aikavälin pituudella, saadaan ilmiön taajuus.” - https://fi.wikipedia.org/wiki/Taajuus

Nythän tämä ei kerro, minkälainen kytkentä on vuosiluvun ja sota/war –sanan välillä; frekvenssi ei kiinnity esim. vuoden 2014 kirjoitettujen/tallennettujen juttujen sisältöön, vaan ylimalkaan kahteen määreeseen, vuosilukuun ja sota/war –ilmaukseen. 

On kuitenkin hyvä huomata, että monestikaan ei sota/war –käsitettä kytketä futuuriin, tulevaan aikaan ja tuleviin vuosilukuihin, vaan nykyisyyteen, kirjoitus- tai tallennusajankohdan vuosilukuun tai päivämäärään; tai sitten menneisyyteen, jo elettyyn aikaan ja päivämäärään. 

Näin ollen käsitteen liittyminen kulumassa olevaan vuoteen (vaikkapa kirjoitus-/tallennusajankohtana vuoteen 2013) liittyvä aineisto saa x-esiintymismäärän (tiheys), mutta seuraavien vuosien, tässä tapauksessa 2014…2016 aikana kertyneet käsitteen + ajan yhdisteet ovat x + (esiintymät vuosien 2014…2016 aikana) = googletettu tulos. 

Näin asiaa tarkastellen voimme nähdä, että jos sota/war –ilmaisun frekvenssi eri vuosina olisi tasainen ja sama: googlattu tulos kohoaisi vanhojen vuosien osalta niiden saaman jälkikarttuman verran.  Silloin suurimmat googlatut tulokset tulisi olla vuoden 2000 vertailugooglauksessa ja 2010 googlauksessa. 

Näin ei kuitenkaan ole, joten mikäli vedämme yhden johtopäätöksen tästä epätieteellisestä esiintymistiheyttä koskevasta hakutoimesta, se on: sota/war on esiintynyt 2010-luvulla vuosi vuodelta useammin.

Toivoisin vielä, että joku selittäisi, miksi 2015 on saanut lähes viisinkertaisen määrän vuosien 2014 ja kuluvan vuoden (osa) tulokseen nähden?

*

Vertailua osakekurssien muutosten ennakointiin

”Voiko Google ennustaa osakekursseja?”

Kirjoitettu 26 huhtikuu 2013, kello 23:22 | Kim/Tom Lindström  |Nordnedblogi.fi

”Toistaiseksi vastaus kysymykseen, voiko Google ennustaa osakekursseja, on kielteinen. Viime vuosina tutkijat ovat kuitenkin saaneet mielenkiintoisia tuloksia sijoitusstrategioilla, jotka perustuvat Googlella tehtyihin hakusanoihin. Tutkijat ovat muun muassa huomanneet, että tiettyjen yhtiöiden nimien Google-hakujen yleisyydellä on ollut yhteys osakekurssin kehitykseen.

Preisin, Moatin ja Stanleyn artikkeli Quantifying Trading Behaviour in Financial Markets julkaistiin eilen. Kirjoittajat olivat analysoineet kuinka hyvin 98 eri hakusanaa soveltuivat kurssikehityksen ennustamiseen. Sijoitusstrategia oli hyvin yksinkertainen. Se perustui yksinkertaisesti Googlessa tehtyjen hakusanojen yleisyyden muutoksiin.”  …

”Sijoittajan näkökulmasta on tietysti mielenkiintoista, että finanssikriisin aikana pystyi saamaan ylituottoa hakusanalla ”debt”, mutta valitettavasti tiedolla ei enää ole arvoa. Sijoittajaa kiinnostaakin enemmän mikä tai mitkä hakusanat tulevat olemaan tärkeämpiä tai vähemmän tärkeitä tulevaisuudessa.

Tuskin on mikään yllätys, että tutkijat yrittävät seuraavaksi selvittää miten voi ennustaa millä hakusanoilla on mahdollista ennustaa tulevaa kurssikehitystä.”

*

“Tutkimus: Google osaa ennustaa pörssiromahduksia”

Talouselämä 29.7.2014 09:44päivitetty 27.8.2015 01:55

http://www.talouselama.fi/uutiset/tutkimus-google-osaa-ennustaa-porssiromahduksia-3460392

”Tutkijoiden mukaan hakukäyttäytymisen tarkkaileminen voisi toimia talouden tilaa mittaavana ennakkovaroitusjärjestelmänä.

Tutkijat loivat sanoista automaattisesti hakuja tarkkailevia algoritmeja luokittelemalla liiketoimintaa ja politiikkaa kuvaavat sanat.Tutkijat hyödynsivät Google Trends -työkalua, jolla he selvittivät, kuinka usein sanoja haettiin.”

”Hakukoneet, kuten Google, tallentavat lähes kaiken mitä etsimme internetistä. Hakutilastojen avulla voimme oppia, kuinka ihmiset keräävät tietoa verkosta ennen kuin tekevät päätöksiä reaalimaailmassa. Näiden tietojen avulla on mahdollista ennakoida, mitä suuret ihmisryhmät saattavat tehdä", arvioi tutkija Chester Curme.”

*

”Twitterin avulla voi todistetusti ennustaa osakekurssien kehitystä”

Sami Metelinen/Verkkouutiset 23.7.2015 klo 08:40 (päivitetty 23.7.2015 klo 13:28

http://www.verkkouutiset.fi/talous/Twitterin%20avulla%20voi%20ennustaa%20osakekurssien%20kehitysta-38774

”Euroopan keskuspankin julkaisema tutkimus osoittaa, että Twitter-aktiivisuus ennakoi osakekurssien kehitystä.”

”Tutkijat huomauttavat, että vaikka Twitter-kommenteilla ja kurssikehityksellä on yhteys, tutkimus ei osoita syy-seuraussuhteita. Teoreettinen kehys ja syy-seuraussuhteet edellyttävät lisätutkimusta.”

*

Mietintään

Heijasteleeko sota/war –ilmausten lisääntyminen 2010-luvulla käynnissä olevien konfliktien ja sotien yleensä saamaa huomiota ja sen mahdollista kasvua, vai onko nähtävissä jokin syy-seuraus –suhde frekvenssien kohoamisessa siinä mielessä, että ”sitä kylliksi ja liikaa, mistä puhe”. 

Eli lisääntyykö sota maailmassa puheesta ja tekstistä (googlausten vasteet) vai ilmenevätkö jo olemassa olevat sodat vasteiden määrän kasvuna?

Voiko Google ennustaa sodan?  Voiko "ilmassa oleva sota" tihentyä todelliseksi sodaksi? 

Tätä sietää miettiä.

*

Piditkö tästä kirjoituksesta? Näytä se!

3Suosittele

3 käyttäjää suosittelee tätä kirjoitusta. - Näytä suosittelijat

NäytäPiilota kommentit (13 kommenttia)

Käyttäjän jgagarin56 kuva
Juha Kuikka

Aika maltillista frekvenssinousua tuo hakuosuman kohdalla viidessätoista vuodessa kuitenkin. Googlessahan on materiaalia vastaavasti monin verroin verrattuna viidentoista vuoden takaiseen tilanteeseen. Kaikki hakusanat antavat nyt enemmän osumia.

Käyttäjän TomiVaalisto kuva
Tomi Vaalisto

Mielenkiintoinen havainto!

YK:n pakolaisjärjestö UNHCRn mukaan sotaa, väkivaltaa ja vainoa pakenevia on nyt selvästi yli 60 miljoonaa ja kotinsa jättäneitä on enemmän kuin koskaan sitten toisen maailmansodan. http://www.unhcr.org/5672c2576.html

Olisiko tässä syy miksi "sota" tärppää googlella entistä useammin? Siis sotaa on ilmassa...

Käyttäjän jlinjama kuva
Jussi Linjama

Ettei olisi tähtien sota joka vääristää vuotta 2015 (The Force Awakens 2015) ?

Käyttäjän TuomoKokko kuva
Tuomo Kokko

Maailma on ennustuksia täynnä, kuin veikkausyhtiön tietojärjestelmä kansalaisten lottorivejä. Aina joskus joku osuu, koska tilastollisesti ei voi olla osumattakaan.

Se mitä minä haluan sodanennustajilta kysyä, on: keitä olette ajatelleet sodan osapuoliksi? Onhan löydyttävä vähintään kaksi sotimishaluista tappelupukaria, jotta sota yleensä on mahdollista käydä.

Käyttäjän jgagarin56 kuva
Juha Kuikka

Toinen osapuoli on Venäjä, joka sitten itse valitsee sen toisen osapuolen.

Käyttäjän TuomoKokko kuva
Tuomo Kokko

Mutta haluaako Venäjä nimenomaan sotaa, vai olisiko se kiinnostuneempi vain ottamaan isännyyden ilmoitusasiana Krimin tapaan?

Käyttäjän jgagarin56 kuva
Juha Kuikka Vastaus kommenttiin #6

Ei sota sille varmaankaan päämäärä sinänsä ole, mutta ei sitä tarvitse välttääkään, jos sen isännyyden otto ei muutoin onnistu.

Käyttäjän TuomoKokko kuva
Tuomo Kokko Vastaus kommenttiin #7

Mahtaako Falkland-saarista v. 1982 käydyn sodan taustaa olla tutkittu perinpohjaisesti? Wikipedia toteaa, että

"Argentiinan sotilashallitus yritti lopulta saarten valtaamista. Otaksuttiin, että Britannia ei ryhtyisi sotilaallisiin vastatoimiin ja että onnistunut aluelaajennus kasvattaisi sotilasjuntan kannatusta..."

Argentiinalle ei Falklandilla onnistunut se minkä Venäjä teki 32 vuotta myöhemmin Krimillä: lipunnosto ja taloksi asettuminen noin vain. Thatcherin hallinto ei päätynytkään virittelemään talouspakotteita ja paheksumaan diplomaattisesti, vaan lähti häätämään miehittäjää. Olennainen kysymys: kuka aloitti sodan, vai vaadittiinko siihen tuossakin tapauksessa kahden osapuolen yksimielisyys sodasta ainoana mahdollisuutena?

Käyttäjän jgagarin56 kuva
Juha Kuikka Vastaus kommenttiin #8

Mielestäni on itsestään selvää, että Argentina aloitti sodan hyökkäämällä vieraan valtion alueelle.

Käyttäjän ilmari kuva
ilmari schepel

Veikko, tervehdys.

Tein saman "kokeen" venäläishakurobotti Yandex:in avulla ("Mäntsälän pilvilinna": yandex.ru). Sen tulos on yhtä kiinnostava (война = sota).

Hakasanoilla "война 2010"
Нашлось 70 млн результатов

Vuosi 2010: война 70 miljoonaa

Vuosi 2011: война 67 miljoonaa

Vuosi 2012: война 107 miljoonaa

Vuosi 2013: война 129 miljoonaa

Vuosi 2014: война 136 miljoonaa

Vuosi 2015: война 177 miljoonaa

Vuosi 2016: война 431 miljoonaa...

Käyttäjän jgagarin56 kuva
Juha Kuikka

Tuo Aleppo ottanee leijonanosan tuosta osumakasvusta esittämässäsi tapauksessa.

Käyttäjän rakennusliikeerbau kuva
Pekka Iiskonmaki

#10
Hieman plogin ulkopuolelta venäjän kielestä. Suomen kielessä on 365 lainasanaa venäjän kielestä ja venäjän kielessä on vain yksi laina suomen kielestä. Kuore (kala).

Esim. Voina sanasta on suomen kielessä väännös vaino/vainolainen.

Käyttäjän iitimo kuva
Timo Isosaari

Maailmalla on tehty jo pitkään softaa, joka analysoi lingvistiikan perusteella tulevia kehityskulkuja:

How To Predict The Future With Linguistics And Technology, Cliff High

https://www.youtube.com/watch?v=VLnon-t9fVQ

Kyseinen herra ennusti ainakin Brexitin ja Trumpin oikein, jopa sen, että Clinton jättää tulematta vaalien jälkeiseen tilaisuuteensa. Sitä en tiedä, moniko ennuste on oikeaan osuneiden lisäksi mennyt pieleen.

Periaatteessa hyödynnän itse vastaavaa menetelmää pelkällä päällä, tutkimalla ristiin valta- ja vaihtoehtomedioita. Tarkkuus ei tietenkään ole paras mahdollinen, kun data sekoittuu omiin, subjektiivisiin käsityksiin. Suuret linjat kyllä erottuvat aika selkeästi kokemuksen karttuessa.

Toimituksen poiminnat

Tämän blogin suosituimmat kirjoitukset