HTML

Piackutatás.blog.hu

Piackutató és marketinges szubkultúra. Kortárs piackutatás, cutting-edge technológiák, kutatási konferenciák, kutatási hírek a hazai és az angolszász piacokról - friss gondolatok, friss hírek a kutatási iparágból, első kézből. A blogot a Forecast Research kutatója szerkeszti.

Piackutatás Hírek

Hírlevél! Emailben értesülhetsz a blogon megjelent új cikkekről. A korábbi Feedburner-es hírlevél sajnos nem működik, újra fel kell iratkoznod, pl. ITT vagy ITT. (Csak add meg a blog RSS URL-jét: https://piackutatas.blog.hu/rss és az email címedet.) Még több hír kell? Iratkozz fel erre a csatornára is: https://www.piackutatas-hirek.hu/rss/osszes-hir

Tagek - Főbb témakörök

access panel (9) acnielsen (2) adat (63) adatbányászat (24) adatbázis (24) adatgyűjtés (14) adatminőség (3) adatrögzítés (2) adatvédelem (3) adatvizualizáció (54) ad hoc (3) affectiva (2) agb nielsen (2) agyhullámelemzés (16) agyszkennelés (13) AI (4) algoritmus (2) álláshirdetés (4) antropológia (1) apple (5) arcfelismerés (9) archetípus (2) arckódolás (13) árérzékenység vizsgálat (3) arf (1) árvizsgálat (3) asszociáció (1) asszociatív technika (1) átirat (2) atkári csaba (1) attitűd (1) augmented reality (1) authority site (1) automata tesztelés (1) avatar (2) b2b (2) babocsay ádám (1) bacher jános (1) barcza enikő (2) bar chart (1) bevásárlóközpont (1) big data (24) big mac index (1) bimodális megoszlás (1) biometria (4) bioszenzor (2) blind teszt (4) blog (9) bpto (2) brainstorming (3) brand (4) branding (2) brand equity (1) brand power (1) brand price trade off (1) brief (2) business intelligence (4) buzzword (1) call center (3) capi (2) casro (1) cati (8) cawi (2) célcsoport (7) chart (39) chio (1) chris anderson (2) cint (3) client service (1) coca cola (14) coke (8) conjoint (2) conjoint elemzés (1) conness (1) consumer insight (18) cookie (1) corvinus egyetem (8) crowdsourcing (1) csoportdinamika (5) csoporthatás (2) customer satisfaction survey (2) David McCandles (1) deli (1) deliberative poll (2) demográfia (6) desk research (1) detektívtükör (10) diagram (4) digg (1) digitális etnográfia (8) digitális média (1) digividuals (1) diktafon (1) disney (1) divat (1) diy (19) diy kutatások (38) domino pizza (1) Dove (1) dove (1) do it yourself survey (35) dunnhumby (2) eeg (4) elkísért vásárlás (1) ellenőrzés (1) előteszt (2) emg (1) emlékkonferencia (1) emotimeter (2) ep választás (1) érdekesség (4) érzékszervi teszt (4) érzelemfelismerés (2) esomar (46) esomar price study (2) etnográfia (37) exit poll (1) exit store (1) eye tracking (21) facebook (22) faktoranalízis (1) feitel balázs (1) felmérés (4) fenomenológia (1) field research (1) finn raben (4) fisheye (1) fmcg (10) fmri (6) fogyasztói csoport (2) fogyasztói magatartás (79) fókuszcsoport (102) fókusz stúdió (14) forrester (11) free (2) gallup (3) gallup poll (1) gamification (10) gazdaságkutatás (2) géczi tamás (2) geofencing (3) geolokáció (5) geolokációs marketing (2) geotargeting (1) gfk (15) gfk emo sensor (1) gfk europanel (1) globális kutatás (7) global market research (3) gmail (1) gmi (1) google (15) google consumer surveys (2) Google Glass (1) gps (1) grafikon (6) groupon (2) guide (2) gvh (1) gyorsétterem (1) hackathon (1) hall teszt (1) hálózatkutatás (6) hálózatok (6) hans rosling (2) henry ford (2) hibahatár (1) hibrid kutatás (3) hipotézis (2) hírlevél (6) hoffmann (1) hoffmann márta (3) hólabda módszer (1) home teszt (3) home use teszt (1) honomichl jelentés (1) hőtérkép (2) humor (34) iat (1) idegtudomány (8) időmérleg (1) ifjúságkutatás (5) immersion day (1) immersive research (1) imperium (1) implicit association test (2) implicit technika (3) index (1) infografika (56) innováció (14) insight (24) insight community (3) intellio visiscan (1) interactive voice response (1) interjú (4) interjúkészítő robot (2) interjúvázlat (1) internet (1) internet penetráció (1) internet technológia (1) in store marketing (3) ipad (6) iphone (11) ipsos (19) iskola (1) iso (10) ivr (1) iwatch (1) iWatch (1) jacobs (1) jakab áron (2) jövőkutatás (8) kantar (6) karrier (6) kártyaválogatás (2) képzés (2) kérdezőbiztos (18) kérdőív (38) kérdőíves interjú (14) kérdőívszerkesztés (11) kétnyelvű kérdezőbiztos (1) kindle (2) kisérőlevél (1) kiss bíborka (2) ki kicsoda (7) kkv (5) kkv piackutatás (1) klenovszki jános (9) kognitív lingvisztika (1) kólapiac (3) kollaboratív felmérés (1) kollázs (4) koncepcióteszt (1) konferencia (41) konjunktúrakutatás (1) kontextus (2) konzultáció (1) kördiagram (8) korreláció (1) kozák ákos (4) közbeszerzés (4) közösségi média (59) közvéleménykutatás (134) kreatív online (1) ksh (3) kurucz imre (2) kutatási iparág (115) kutatásmódszertan (7) kutatás konferencia (4) kutatócentrum (1) kvalitatív (55) kvantitatív (13) kvótás mintavétel (1) lifelogging (4) linkedin (4) loréal (1) mácsai tamás (1) márkaépítés (26) márkaerő (17) márkaérték (4) márkaismertségi kutatás (1) márkakutatás (25) márkapreferencia (32) márka kommunikáció (32) marketing (74) marketingkutatás (104) marketingkutató magazin (5) marketingstratégia (9) marketing insight (10) markettools (1) market research (15) marlboro (1) mba (1) mcdonalds (2) mckinsey (1) médiakutatás (12) megfigyelés (9) mélyinterjú (16) mém (5) memetika (1) memetikai marketing (2) memrb (1) mesterséges intelligencia (4) mészáros józsef (2) microsoft (1) milka (1) millenniumi generáció (1) millward brown (10) minőségbiztosítás (11) minőségi piackutatás (7) minőségi piackutatásért egyesület (1) mintanagyság (2) mintavétel (4) mmsz (2) mobil kutatás (21) moderátor (20) moderators guide (3) motivációkutatás (12) motívumkutatás (3) mp3 (1) mra (2) mroc (16) mrsz (1) multimédia (1) műszeres mérés (7) mutf (3) mystery calling (1) mystery shopping (8) mystery visit (1) nano kérdőív (2) napi chart (19) natural language processing (1) near field communication (1) népsűrűség (1) nestlé (1) netnográfia (5) net promoter score (3) neurológia (8) neuromarketing (31) neuroökonómia (2) new mr (10) nézettség mérés (2) nfc (1) nielsen (8) nigel hollis (3) nlp (2) nonverbális kommunikáció (3) nordsee (1) nps (3) nrc (6) nyelvi relativizmus (1) ogilvy (4) okostelefon (11) oktatás (1) omnibusz (3) online (30) online analitika (1) online community (27) online fókuszcsoport (18) online közösség (33) online kutatás (102) online marketing (1) online market research (1) online market research in Hungary (1) online panel (51) online piackutató (1) online video (4) openamplify (1) opinion leader (2) optimus (1) panel (46) panelmenedzsment (2) páros interjú (1) pártpreferencia (1) pay for performance (1) peanut labs optimus (1) pepsi cola (4) persil (1) pet (1) piacbefolyásolás (5) piaci stratégia (4) piackutatás (957) piackutatási diákverseny (9) piackutatás állás (2) piackutatás ázsiában (1) piackutatás blog (7) piackutatás felszabadítási front (2) piackutatás hírek (125) piackutatás képzés (1) piackutatás mém (1) piackutatás napja (5) piackutatás napja konferencia (6) piackutatás története (1) piackutató (352) piackutatók magyarországi szövetsége (8) piackutató bot (6) piackutató intézetek (8) piackutató robot (8) pie chart (17) pilot interjú (1) Pinterest (1) pintér róbert (3) pixer (3) pmsz (26) politikai véleménykutatás (13) populáció (1) portfolioblogger (30) postteszt (1) posztgraduális képzés (1) powerpoint (14) ppt (17) prediktív analitika (2) preteszt (5) prezentáció (19) prezi (3) price sensitivity measure (1) price study (2) primer piackutatás (1) prizma (1) próbavásárlás (7) professzionális piackutatók társasága (6) projektív technikák (2) promedius (1) psm (2) pspp (1) pszichodráma (1) pszichológia (3) qr kód (7) qsensor (1) quantified self (1) quick and dirty (2) readers digest (1) reckitt benckiser (1) red bull (2) reklám (18) reklámkutatás (11) reklámteszt (12) relevant id (1) reprezentatív (8) reprezentativitás (1) research international (1) research liberation front (1) research world (5) retail audit (1) rfid (4) river sample (1) river sampling (1) rlf (1) roi (6) round robin (2) rss (2) sapir whorf (1) sara lee (1) scholl (1) screening questions (1) script (1) second life (3) shopper kutatás (3) síklaki istván (1) Síklaki István (1) skinvertising (1) SMS kutatás (1) social media (30) social network (7) SoLoMo (2) spin doctor (1) spontán márkaismeret (1) spss (9) stan sthaunathan (2) starbucks (1) statisztika (71) steve jobs (4) storytelling (1) superbrands (1) surf (1) survey (4) surveygizmo (1) survey monkey (8) synovate (6) szakértői interjú (1) szakértő válaszol (1) szavazás (7) szegmentáció (5) szekunder piackutatás (1) szekvenciális monadikus (1) szemantika (2) szemiotika (7) szemkamera (20) szemkamerás vizsgálat (18) szemkövetés (12) szemkövetéses vizsgálat (15) szerepjáték (2) szignifikáns (2) szimulált depriváció (2) szociálpszichológia (2) szociodemográfia (2) szociológus (1) szondaphone (3) szonda ipsos (5) szövegelemzés (10) szubkultúra (1) szűrőkérdőív (1) tablet (1) taktikai piackutatás (4) támogatott márkaismeret (1) tanácsadás (6) tanulmány (1) tárki (1) társadalomkutatás (6) társadalomstatisztika (3) társadalomtudomány (6) tartalomelemzés (3) technológia (4) technológiai szingularitás (4) telefonos kutatás (16) telemarketing (6) tematikus ajánló (8) tender (1) terepnapló (1) termékfejlesztés (12) termékteszt (5) tervező team (2) tesco (4) tesco direct (1) tesztáruház (1) tesztpiac (1) tetszési index (1) texting (1) text mining (2) tns (8) tns hoffmann (1) tobii (1) toborzás (2) toluna (6) topline (2) történetmesélés (1) tracking kutatás (1) transzhumanizmus (2) trend (90) trendkutatás (2) triád interjú (1) truesample (3) twitter (21) u&a (1) üdítőpiac (1) ugc (1) ügyfélelégedettségi kutatás (2) ügyfélkapcsolat (2) új piackutatás (7) unilever (3) usage attitude (1) usp (1) utópia (2) vakteszt (2) válaszadó (2) választáskutatás (1) valóságshow (1) valószínűségi mintavétel (3) vásárlóerő (1) vélemény (2) véleményvezér (1) venn diagram (9) vevőelégedettségi kutatás (1) vezérfonal (2) videó etnográfia (2) világpiac (2) virtuális kérdezőbiztos (1) virtuális piackutatás (2) viselhető eszközök (1) viselkedés gazdaságtan (5) visszaemlékezés (2) vizi ferenc (2) Vizi Ferenc (1) vizuális etnográfia (2) vörös csilla (2) web2.0 kutatás (3) web analitika (1) web tracking (1) who is who (7) widget (1) wikipedia (1) wom (1) workshop (3) youtube (1) y generáció (9) závecz tibor (1) zweifel (1) Címkefelhő

Creative Commons licenc

Creative Commons Licenc

A szövegelemzés útvesztői

2011.09.30. 05:06 Forecast Research - www.forecast.hu

A cégek a szövegelemzés módszereihez nyúlnak annak érdekében, hogy képet kapjanak, mit mondanak róluk a fogyasztóik az interneten.

Azok, akik siránkoznak az e-mail, az sms és a Facebook keltette hatáson, hajlamosak elfelejteni valamit: a fiatalok, akik ezeken nőttek fel, sokkal-sokkal többet írnak, mint az előző generációk. Talán nem tisztelik eléggé a hagyományos írás követelményeit, de megteremtik a saját maguk nyelvét és különböző stílusban, különböző közösségekben beszélik azt.

A folyamat során rengeteg olyan adat keletkezik, melyet a marketingesek szenvedélyesen értelmeznek. Ez a szöveg megértését és átérzését jelenti – számos technológiai cég sorakozik fel, hogy segítse ebben a kutatókat, és mindegyikük nagyobbat mond arra vonatkozólag, hogy nekik van jobb eszközük arra, hogy pontosan tolmácsoljanak és kategorizáljanak milliós nagyságrendű hozzászólásokat. Ezek a szövegelemző eszközök jártasak abban, hogy márka referenciákat találjanak meg a hatalmas volumenű online kommunikációs világban, minden egyes nap. A márkákról alkotott vélemények azonban igen változatosak attól függően, hogy a hozzászólás pozitív, negatív töltetű, esetleg egyik sem.

Helyes és helytelen

A FreshMinds által tavaly készített tanulmány kimutatta, hogy az automatizált érzelem-elemző eszközök mindössze 30 %-ban pontosak – másképp fogalmazva jobban járnál a pénzfeldobással is. Az eszközök készítői mégis azt állítják, hogy nem volt fair letesztelni szoftverüket azelőtt, hogy az adott téma kérdéseivel kapcsolatos nyelven tesztelhették volna.

Anna Tomkowicz, a FreshMinds vezető piackutatási menedzsere nyilatkozta a Research-nek: ”Tapasztalataink szerint nem létezik egyetlen vezető szövegelemzési eszköz, és lehetetlen megállapítani, ha valamely ezek közül jelentősen fejlődne – bár kezdetben nem voltak képesek azonosítani a re-tweet-eket (Twitter közösségi oldal hozzászólásai) és a spam-eket (körleveleket) ma meg már képesek erre is.”

A közösségi média figyelő Radian6 cég nemrég jelentette be tervét egy olyan szövegelemző eszközre, mely különböző képességeket egyesít 6 különböző gyártótól – jelezve, hogy a felhasználók egy sor válaszlehetőséget keresnek ahelyett, hogy egyetlenben megbíznának. Ez azonban nem jelenti, hogy tompulna az érdeklődés: a Radian6 céget márciusban 326 millió dollárért kelt el.

Természetesen minden esetben optimalizálni kell a költségeket, az időzítést és a pontosságot, amikor szövegelemzést végzünk. Ha azonban döntéseket akarsz a kutatásra alapozni, az eszközöknek erős lábon kell állniuk - mondja Tomkowicz. „Az érzelmek felbecsülése a márkához kapcsolódó negatív és pozitív töltetű szavakkal történik. A vegyes érzelmek közömbösnek számítanak az elemzés eszközei szerint, de meg kell különböztetnünk vegyes és közömbös érzelmet, mert a vegyes azt is jelenti, hogy az adott személy elégedett a brand egyes vonásaival, de elégedetlen másokkal, ez pedig rendkívül használható adat az ügyfél számára.”

Másik fontos szempont a szóban forgó szöveg hosszúsága. Az érzelmeket vizsgálók hajlamosabbak a Twittert használni más közösségi oldalak helyett a 140 karakteres limit miatt.

A Spectrum Consulting munkatársa, Mark Westaby meg van győződve az automata elemzés működéséről. A Spectrum jelentéstani asszociációkat használ az érzelmek mérésére – azon alapul a technika, hogy az emberi agy a szavakhoz képzetet társít – így nincs szükség szoftverre a folyamathoz. „A módszer akadémiailag tesztelt és igazoltuk vele a saját, piackutatásunkat, mely magas arányban mutatott egyezést”- mondja Westaby.

Akár felismernek az elemző eszközök iróniát és szarkazmust, akár nem, ez a kérdés sokszor felmerül a humán analízis tanácsadók körében, bár Westaby szerint „ez csak szóbeszéd, ami sosem jelenik meg a munkánkban”.”Látva a szövegek méretét, melyeket elemzünk, az ironikus, szarkasztikus hibák arány nagyon kicsi és az elfogadhatóság határán belülre esnek.” „A fals pozitív és negatív válaszok sem számítanak nagy ügynek.”

„Kifejlesztettük a saját Lickert-skála elemzésünket (pszichometriai módszer), amely nagyon hatásos olyan oldalak követésére és elemzésére, mint a Twitter, ahol a szigorú karakterszámok miatt az emberek jellemzően a „szeretlek” és „utállak” szavakat használják az érzelemkifejezésre.

Az érzelmek mérése általában vagy az adott kifejezés szótárbeli jelentésén, vagy a természetes nyelvi folyamatokon keresztül történik. A szótáralapú rendszerek épp olyan pontosak és naprakészek, mint a szótárak, melyeken alapulnak – a visszatérő szavak hozzáadhatóak, azonban néha feltűnnek hiányosságok.

A természetes nyelvképző rendszerek rugalmasabbak – algoritmusokat használnak, melyek óriási mintadokumentumok elemzése során felállított szabályok alapján készültek, néhány szót pedig információval címkéznek fel arról, mit jelentenek, vagy hogyan viszonyulnak a szöveg egészéhez. Ezek a rendszerek könnyebben magukba fogadják a szlenget és az új szavakat, de rendellenességek így is felmerülnek. Például ha a rendszer talál egy csoportot olyan kommentekkel, mint: ”Gyűlölöm a karácsonyt a szörnyű családom miatt”, a karácsonyt negatív fogalomként fogja kódolni – tévesen. Időbe telhet, amíg néhány pozitív karácsonnyal kapcsolatos említés érkezzen, és változtasson a rendszer.

„Mindkét megközelítésnek vannak hibái, akárcsak az embereknek”- mondja Annie Pettit, a Conversition piackutató cég vezetője. „Fontos emlékeznünk arra, hogy nem foglalkozunk az egyéni üzenetek kódolásának helyességével. Ami minket érdekel az, hogy a hatalmas számú üzenetmennyiség összesített kódolása érvényes legyen. Nem próbáljuk bizonyítani, hogy egy adott személy szereti vagy utálja a Pop-Tart-ot, azt próbáljuk bizonyítani, hogy egymillió ember szereti, avagy utálja azt. Egy 70%-ban pontos kiértékelés valójában egy nagyon pontos kiértékelés.”

Az automata módszerek aránya azt is jelzi, hogy kevesebb pontossággal is végezhetőek - mondja Pettit. „Ha az emberi üzenetek százaiból 85% érvényes lesz, míg a computer által végzett száz elemzésből 70% a felhasználható, ez azt jelzi, hogy a számítógép értékelhető opció lesz az óriási méretű adatbázisok esetén”.

Az üzlet pezseg

A szövegelemző eszközök gyártói készek hasznot húzni abból a folyamatból, amely során a közösségi hálók megfigyelése az üzleti életre terjed ki. A fogyasztói kapcsolatok menedzselésével foglalkozó cégek különös érdeklődést mutatnak a terület irányában, a Salesforce például felvásárolta a Radian6 médiafigyelő céget az Overtone-t pedig a Kana Software kebelezte be. 

A szövegelemző eszközök különösen azoknak a cégeknek keltették fel az érdeklődését, melyek kíváncsiak arra, hogy fogyasztóik mire készülnek éppen, és fontosnak tartják, hogy hamar reagáljanak, ha a fogyasztóknak problémájuk adódna. A Salesforce szerint a Radian6 beillesztése szolgáltatásaikba valós idejű közösségi intelligenciát fog eredményezni.

A Radian6 használói számára nem lesz egyetlen szövegalapú elemző módszer. A cég nyilvánosságra hozta, hogy az OpenAmplify-al, a Klout-tal és az OpenCalais-al fog együttműködni a szöveges és érzelem-elemző módszereik tekintetében, és azt is tervezi, hogy felhasználja a Clarabridge, a PeekYou és a Lexalytics elemzéseit. A cég első embere, Marcel Lebrun szerint a partnerség segítette őket, hogy „felhalmozzák a szemantikailag leggazdagabb közösségi adatbázist a világon.”

Egy másik közösségi média figyelő, a Visible Technologies egy újabb 6 millió dolláros befektetést eszközölt röviddel a Radian6 felvásárlása után, Kelly Pennock vezérigazgató szerint a felvásárlás „növelte a jelentőségüket” más médiafigyelőkkel szemben.

Írott világunk

„A nyelv nüansznyi különbségeinek kezelése érdekében a szoftvernek remek kódolással kell rendelkeznie, mely számításba veszi a szlenget éppúgy, mint a szavak kontextusban való megértésének képességét”- mondja Theo Downes-LeGuin, a Market Strategies International vezető munkatársa. Elismeri, hogy a szarkazmust az egyik legnehezebb dolog dekódolni, mivel a hangnem és a hangsúly gyakran olyan mélyebb összefüggésekre utalnak, melyek túlmutatnak az adott szövegen.

Egy jó szövegelemző eszköz az olyan kijelentést, mint például „Köszi, NatWest, hogy uzsorakamatot számoltatok fel” szarkazmusnak minősíti, mert a gyakori pozitív „köszi” szócska súlytalanná válik a súlyosan negatív „uzsora” kifejezés mellett. Egy olyan mondat azonban, mint „Köszi, NatWest, hogy ilyen csodásan magas kamatot számoltatok fel” hibásan pozitívként kódolható, kivéve ha egy nagyobb szövegegység részeként létezik és értelmezhető csupán.

A legtöbb közösségi média elemző eszköz arra alapozza az érzelem-elemzését, hogy az előzetesen „jónak” vagy „rossznak” titulált kifejezések ugyanazokban a mondatokban bukkannak-e fel, amelyekben a keresett kifejezés. A NetBase vezető marketing munkatársa, Lisa Joy Rosner szerint a probléma ezzel a megközelítéssel az, hogy egy szöveg értő olvasása sokkal összetettebb annál, mintha csak bizonyos szavak jelenlétét és előfordulásának gyakoriságát keressük meg. Fals pozitív és negatív kifejezések bukkannak fel, és nincs tökéletes eszköz a piacon arra, hogy minden érzelmet tökéletesen azonosítson. Ahogy Rosner mondja, minden relatív. „Számos tanulmányban azt mutatták ki, hogy a pontosság mértéke nem nagyon lépi át a 85%-ot.”

A kérdőív szoftvereket készítő Vovici szenior termékfejlesztési igazgatója, Scott Blacker azt mondja, az eszközök többsége „új perspektívák szerint dolgozik”. „A rossz eszközök nagyon rosszak, és még a jók sem haladják meg pontosságban a 80%-ot, de az emberek is ilyenek, ők is különböznek. Az szövegelemző szoftverek lehetnek arra programozva, hogy fejlesszék a pontosságot, szóval minél többet fektet be az ember ezekbe a fejlesztésekbe, annál pontosabb adatokat kap. A kezdő adatmennyiség nagysága kulcskérdés, hiszen az minél nagyobb, annál nagyobbnak kell lenni a felhasznált példának is.”

A Vovici társalapítója, Jeffrey Henning hozzáteszi, hogy néhány eladó megkísérelte az emberi hatékonyságot a gépivel összevetni, azonban „nem sokan tették ezt különleges pontossággal...”

Adathalmaz

Az automata érzelem-megfigyelés stratégiájának első lépcsőfoka az, hogy meghatározod, mit akarsz lemérni, mondja az Alta Plana Corporation tanácsadó cég alapítója, Seth Grimes. „Ha már ezt felfedezted, összegző mutatókat, terveket tudsz meghatározni, trendeket összehasonlítani és így tovább. Fogd ezeket a nem is annyira alapnak számító alapokat mielőtt olyan komplex problémákkal találkozol, mint az irónia és a szarkazmus, hiszen azokat nagyon nehéz szisztematikusan kódolni. Ha nem értesz egyet az automata móddal, akkor majdnem biztos, hogy nyelvi technikákra lesz szükséged, melyek megegyeznek a szóhasználattal, a szókinccsel és a kifejezésekkel, melyek iróniát és szarkazmust jeleznek.”

Ha angoltól különböző nyelvekkel dolgozol, ne ess csapdába azt gondolva, hogy elég lefordítanod azt angolra, elemezni, aztán újra eredeti nyelvre fordítani – az érzelmet kifejező szavak különösen nehezen fordíthatóak. Ilyen esetekre ajánlja Grimes egy egyszerű elemzés lefolytatását, a többit pedig hagyjuk az emberekre. „Kevésbé használt nyelv esetén kezdj el kidolgozni egy lexikont az érzelmet kifejező szavakból („kedvel” „szeret” „utál” „rossz”) a célnyelvre fordítva és használd az érzelmek felkutatására további elemzések során. Egy félig automatizált elemzés is jobb, mint egy csupán ember alkotta megoldás.”

Van még egy összetevője a szövegelemzések nehézségének: nem elegendő csupán azt tudnunk, hogyan viselkednek, kommunikálnak, lépnek kapcsolatba az emberek az interneten. Először is, a nyelv eltér attól, amit más környezetben használnak, emellett gyorsan is fejlődik. Elméletileg a szleng, a köznyelv és a rövidítések nem okozhatnak problémát egészen addig, amíg azok megfelelően vannak felcímkézve a szoftverek számára. Ezek a dolgok azonban folyamatos változásban vannak, szóval a szövegelemző módszerek kérdése örök.

Rosie Campbell, a Campbell Keegan igazgatója szerint „az online kapcsolattartásnak megvannak a maga szabályai, így akik részt vesznek benne, jellemzően a fiatalok – akik nem is nagyon írnak le semmit, ami nincs iróniával fűszerezve, és nem hinném, hogy a szövegelemzők képesek lennének kiszűrni ezt.”

A szöveg ébredése

A piackutatás nem az egyetlen terület, amely érdeklődik a szövegelemzések után.

A módszert gyakran használják a titkosszolgálati területen, IT biztonsági kérdésekben, jogi folyamatok során és még a gyártási folyamatok lehetséges problémáinak felderítésében is. A cégeknek egyre inkább figyelniük kell „információs politikájukra”, adataik kezelésére.

A piackutatás területén belül a szövegelemzések használata nem korlátozódik a közösségi médiára. Az Attensity által rendezett webkonferencián a 451 Group munkatársa, Nick Patience körülírta mindazt, ahogy a közösségi média megjelenése lehetővé tette a cégek számára, hogy úgy készítsenek kérdőíveket, hogy aztán gyorsan és hatásosan elemezhessék a nyílt kérdéseket.

„Néhány helyen olyan népszerűvé vált a dolog, hogy tulajdonképpen a kérdőívek természetét is megváltoztatta. Láttunk régebben olyan cégeket, melyeknek, mondjuk 30 kérdéses tesztje volt, az első 29 meg volt szerkesztve, majd az utolsó kérdés így szólt: van egyéb megjegyzése? A szövegelemzések ezt teljesen megváltoztatják, olyannyira, hogy néhány előrelátó cég már nyílt kérdésekkel is dolgozik. Ezt lehetetlen volt megtenni a szövegelemzések előtt, amikor megfelelő számú válaszlehetőséggel lehetett csak számolni. Ez egy olyan terület, melyet a szövegelemzések alapjaiban változtattak meg.”

Ítéletnap

A Terminátor-filmek szerint március 19-e az a nap, amikor a világ computerei öntudatra ébrednek, nukleáris Armageddont idézve elő, valamint az emberi faj majdnem teljes pusztulását. Szerencsére a valóságban még nem történt meg, hogy a gépek átvegyék a világot az emberektől, és egyetértés van arról, hogy az éles elméjű professzoroknak ma is kulcsszerepe van abban, hogy egy-egy elemzés adatait értelmezzék – és abban is, hogy stratégiai lépéseket dolgozzanak ki.

Grimes és Henning egyetértenek abban, hogy a helyes megközelítés a dolgok keresztezése. A gépek sebességét, befogadóképességét és következetességét ki kell használni, de az embereknek tanulni, irányítani és felügyelni kell az automatizált rendszereket és közvetíteniük felfedezéseiket.

Az automata rendszerek óriási előnye tulajdonképpen az, hogy pénzt spórolnak az adatgyűjtésen, és több időt adnak az insightok elemzésére, mint amennyi nélkülük lenne.

„Bizonyos módon az automatizált elemzés több lehetőséget nyújt a kutatásra”- kezdi Hennings – „Néhány cég kiszervezi az adatgyűjtését, hogy takarékoskodjon, de ezek az eszközök lehetővé teszik számukra, hogy cégen belül oldják meg azt.”

Természetesen a siker nem csak a szövegelemzés képességének megtanulásán múlik, hanem a kutatókon, hogy megtanulják, hogyan vessék be legjobban ezeket az eszközöket a munka során.

Szólj hozzá!

Címkék: adatbázis piackutatás adatbányászat szövegelemzés

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.
süti beállítások módosítása