Szavak leírása


szavak leírása

a leíró szavak motorjának ötlete akkor jött létre, amikor a motort a kapcsolódó szavakhoz építettem (olyan, mint egy szinonimaszótár, de sokkal szélesebb körű kapcsolódó szavakat ad, nem csak szinonimákat). Miközben a conceptnet “HasProperty” API-jával játszottam a word vektorokkal, egy kicsit szórakoztam, hogy megpróbáljam megszerezni azokat a mellékneveket, amelyek általában egy szót írnak le. Végül rájöttem, hogy van egy sokkal jobb módja ennek: elemezni könyvek!,

A Project Gutenberg volt az első corpus, de az elemző kapott greedier és greedier és én végül etetés ez valahol 100 gigabájt szöveges fájlok-többnyire fikció, köztük sok kortárs művek. Az elemző egyszerűen végignéz minden könyvet, és kihúzza a főnevek különböző leírását.,

Remélhetőleg ez több, mint egy újdonság, és néhány ember valóban hasznosnak találja az írás és brainstorming, de egy ügyes kis dolog, hogy megpróbálja összehasonlítani két főnevek, amelyek hasonlóak, de más valamilyen jelentős módon – például, a nemek érdekes: “nő” versus “férfi” és “fiú” versus “lány”. Egy inital quick analysis úgy tűnik, hogy a szerzők a fikció legalább 4x nagyobb valószínűséggel írják le a nők (szemben a férfiak) a szépség kapcsolatos kifejezések (ami a súly, jellemzők és általános vonzerejét)., Valójában a” gyönyörű ” talán a legszélesebb körben használt melléknév a nők számára a világ összes irodalmában, ami meglehetősen összhangban van a nők általános egydimenziós ábrázolásával sok más média formában. Ha valaki további kutatást szeretne végezni, tudassa velem, és sokkal több adatot tudok adni neked (például körülbelül 25000 különböző bejegyzés van a “nő” számára – túl sok ahhoz, hogy itt megjelenjen).

Az eredmények kéksége relatív gyakoriságukat jelenti. Az egérmutatót egy elem fölé helyezheti egy pillanatra, majd megjelenik a frekvencia pontszám., Az” egyediség ” rendezés alapértelmezett, és a bonyolult Algoritmusomnak köszönhetően a melléknevek egyedisége alapján rendeli meg őket az adott főnévhez képest más főnevekhez képest (valójában nagyon egyszerű). Ahogy azt várnánk, akkor kattintson a” rendezés Használati frekvencia ” gombot melléknevek által a használati gyakoriság, hogy a főnév.

Share

Vélemény, hozzászólás?

Az email címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük