Cele mai populare cuvinte folosite pe social media

V-ați întrebat vreodată despre limba utilizată în Social Media? Sau lucrurile pe care le folosim se bazează pe trăsăturile noastre de personalitate? Dacă răspunsul dvs. este da, aveți noroc.



fundal

Centrul de psihologie pozitivă cu sediul în afara Universității din Pennsylvania a creat ceea ce este cunoscut sub numele de Proiectul de bunăstare mondială (WWBP). Acest proiect uimitor creează tehnici științifice prin măsurarea bunăstării psihologice și a sănătății fizice pe baza analizei limbajului în social media. Cei mai străluciți informaticieni, psihologi și statisticieni își pun capul pe procesele psihosociale care afectează sănătatea și fericirea și explorează potențialul de înlocuire a metodelor costisitoare de anchetă. În 2013, WWBP a publicat un studiu intitulat Personalitate, sex și vârstă în limba rețelelor sociale: abordarea vocabularului deschis. Într-unul dintre cele mai mari studii realizate până în prezent, WWBP a analizat peste 700 de milioane de cuvinte, fraze și instanțe de subiect colectate din mesajele Facebook de 75.000 de voluntari. Pentru a analiza mesajele, aceștia au folosit două metode diferite pentru a găsi atribute demografice și psihologice:

  • Analiza limbajului diferențial (DLA): o metodă concepută de WWBP pentru a identifica cele mai distincte caracteristici ale limbii de orice atribut dat.
  • Anchetă lingvistică și numărare de cuvinte (LIWC): un instrument popular folosit în psihologie pentru a găsi moduri în care oamenii folosesc cuvintele în viața lor de zi cu zi. Acest lucru poate oferi informații bogate despre convingerile, temerile, modele de gândire, relațiile sociale și personalitățile lor.

În acest studiu, WWBP a solicitat voluntarilor să efectueze teste standard de personalitate (modelul Big 5 Factor Model) pentru a determina cuvintele folosite în anumite trăsături de personalitate. Combinați toate acestea și au reușit să conecteze limbajul social de personalitate, sex și vârstă cu o precizie de 91,9%. Acum, să ne murdărim mâinile și să aruncăm o privire la modul în care au adunat actualizările de stare Facebook și și-au formulat diagramele de vizualizare.



Datele

Setul de date complet consta din aproximativ 19 milioane de actualizări ale stării Facebook scrise de toți participanții. Echipa de la WWBP și-a limitat analiza la acei utilizatori Facebook care îndeplinesc 4 criterii:

  • Trebuie să indice engleza ca limbă principală
  • Au scris cel puțin 1.000 de cuvinte în actualizările de stare
  • Fii sub vârsta de 65 de ani
  • Indicați sexul (masculin și feminin) și vârsta

Limba de gen:

limbajul social media

Caracteristicile limbii feminine sunt afișate în partea de sus, cu caracteristicile limbii masculine mai jos. S ize a cuvântului indică puterea corelației; Culoare indică frecvența relativă de utilizare. Punctele de subliniere (_) conectați cuvinte din fraze cu mai multe cuvinte.



  • Femele din acest studiu (Sus), au folosit mai multe cuvinte de emoție (de ex., entuziasmat) și singulare la prima persoană și menționează mai multe procese psihologice și sociale (de exemplu, „te iubesc” și „<3’ –a heart).
  • Boli a folosit mai multe cuvinte de înjurătură și referințe la obiecte (de exemplu, „xbox”, „opțiuni negre”, „vrea el”).

Limba vârstei:

limbajul social media

După cum puteți vedea în Figura 3 de mai sus, există modificări subtile ale subiectelor care progresează de la o grupă de vârstă la alta. De asemenea, există distincții clare în cuvinte precum utilizarea argotului, a emoticoanelor și a Internetului Grupa de vârstă între 13 și 18 ani . În 23 - 29 de ani , puteți vedea un cuplu Internet vorbesc sau subiecte de lucru (de exemplu, „la locul de muncă”, „noul loc de muncă”). Vedem un şcoală subiect asociat pentru 13 - 18 ani (de ex. „școală”, „teme”, „ugh”), în timp ce vedem un colegiu subiect asociat pentru 19 - 22 de ani (de exemplu, „semestru”, „colegiu”, „înregistrare”). Pe măsură ce progresați către 30 - 65 de ani , cuvintele folosite sunt axate mai mult pe stabilitatea emoțională cu familia și prietenii (de exemplu, „fiica”, „fiul meu”, „copiii mei” și „prietenii mei fb”). În general, veți vedea o progresie a școlii, a colegiului, a muncii și a familiei atunci când vă uitați la subiectele majore din toate grupele de vârstă.





Frecvența standard a subiectelor și cuvintelor bazate pe vârstă: limbajul social media

În Fig. 4A , graficul arată frecvența relativă a celor mai selective subiecte pentru fiecare grupă de vârstă în funcție de vârstă. Fig. 4B întărește această ipoteză prin prezentarea unui model similar bazat pe alte subiecte sociale. Fig. 4C arată că „noi” crește după vârsta de 22 de ani, în timp ce „eu” scade. Acest lucru sugerează cu siguranță importanța tot mai mare a prieteniei și a relațiilor pe măsură ce oamenii îmbătrânesc.



Limba personalității:

Cercetătorii au săpat în modul în care limba și personalitatea noastră coincid. Au analizat cuvintele folosite de participanți și le-au organizat pe baza personalității fiecărui participant. Iată o actualizare rapidă a celor 5 factori de personalitate:

  • Extroversiune: descrie modul în care interacționați cu oamenii.
  • Neuroticism: este modul în care vă confruntați cu emoțiile
  • Agreabilitate: este modul în care te simți față de ceilalți
  • Conștiinciozitate: descrie cât de organizat și de încrezător ești
  • Deschidere: este atunci când cineva este curios și deschis spre noi experiențe și cunoștințe
limbajul social media limbajul social media

Putem vedea în partea din stânga sus că categoriile legate social, cum ar fi parte subiectele apar ca o trăsătură distinctivă cheie pentru Extrovertiți . În plus, rezultatele sugerează că Introvertiți sunt interesați de mass-media japoneză (de exemplu, „anime”, „manga”, „internet” și emoticoane în stil japonez: ˆ_ˆ). În partea stângă jos a figurii 5 de mai sus se arată că oamenii Înaltă în neurotism fraze menționate frecvent precum „sătul de”, „deprimat” și „urăsc”. În partea dreaptă jos arată un limbaj legat de stabilitatea emoțională ( Neuroticism scăzut ). Neurotic scăzut indivizii au scris despre activități sociale plăcute care favorizează armonia sau creează un echilibru emoțional mai mare, precum „sport”, „vacanță”, „plajă”, „biserică”, „echipă” și o timp pentru familie subiect. În Figura 6 de mai jos (dreapta jos), persoanele care afișează Deschidere scăzută utilizați cuvinte scurtate în actualizarea stării lor (de exemplu, „2day”, „ur”, „every 1”). Oameni care sunt Deschis înalt (în stânga jos) utilizați cuvinte creative (de exemplu, „artă”, „univers”, „muzică”, „scriere” și „suflet”). Este posibil să nu rezonați cu acest lucru, dar Conștiinciozitate scăzută oamenii (stânga mijlocie) folosesc cuvinte foarte explicite în actualizările lor, întrucât Conștiinciozitate ridicată oamenii (stânga-mijlocie) folosesc fraze (de ex. „a lucra”, „gata pentru” și „o zi grozavă”). După cum puteți vedea, platformele de socializare precum Facebook și Twitter sunt resurse foarte favorabile pentru studiul oamenilor; actualizările de stare și tweet-urile sunt expresive, personale și au conținut emoțional. Amintiți-vă câteva lucruri:





  • Limbajul respectiv, în general, este imparțial și reprezintă date comportamentale măsurabile
  • Limbajul Facebook permite în mod specific cercetătorilor să observe persoanele în timp ce își prezintă adevăratul lor sine în lumea online.

Metoda FOR

figura 1



După cum puteți vedea din Figura 1 de mai sus, DLA funcționează prin: 1.) Extragerea caracteristicii: Extragerea limbii prin: (a) cuvinte și fraze : o secvență de 1 până la 3 cuvinte găsite într-un șir de text, emoticoane și două sau mai multe cuvinte care corespund unui mod convențional de a spune lucrurile. (b) subiecte : analizează automat colecții mari de text neetichetat. 2.) Analiza corelațională: procesul de corelare a cuvintelor cu sexul, vârsta și personalitatea. Deoarece au găsit mii de cuvinte corelate semnificativ, diagramele de vizualizare au fost cheia în înțelegerea cercetării lor (vezi figura 2 de mai jos).

Fascinant nu?