Kuvaavat Sanat
idea Kuvaavat Sanat moottori tuli, kun olin rakentamassa moottoria Liittyviä Sanoja (se on kuin sanakirja, mutta antaa sinulle paljon laajempi joukko liittyviä sanoja, eikä vain synonyymit). Kun pelaa noin sana vektorit ja ”HasProperty” API conceptnet, minulla oli vähän hauskaa yrittää saada adjektiiveja, jotka yleisesti kuvaavat sanan. Lopulta tajusin, että on olemassa paljon parempi tapa tehdä tämä: jäsenkirjat!,
Project Gutenberg oli ensimmäinen corpus, mutta parser on ahnaammin ja ahnaammin, ja päädyin ruokinta se jonnekin noin 100 gigatavua teksti – tiedostoja- enimmäkseen fiktiota, kuten monet nykytaiteen teoksia. Jäsennin vain katsoo jokaisen kirjan läpi ja vetää esiin substantiivien eri kuvaukset.,
Toivottavasti se on enemmän kuin uutuus, ja jotkut ihmiset todella löytää se hyödyllistä, sillä niiden kirjoittaminen ja ideointi, mutta yksi siisti pieni asia kokeilla on verrata kaksi substantiiveja, jotka ovat samankaltaisia, mutta eri jollakin merkittävällä tavalla – esimerkiksi sukupuoli on mielenkiintoinen: ”nainen” ja ”mies” ja ”poika” ja ”tyttö”. Siitä alkuperäisestä nopea analyysi näyttää siltä, että laatijat fiktio ovat ainakin 4x enemmän todennäköisesti kuvaamaan naisten (toisin kuin miehet), kauneus-liittyvät ehdot (koskevat niiden paino, ominaisuuksia ja yleistä kiinnostavuutta)., Itse asiassa, ”kaunis” on mahdollisesti yleisimmin käytetty adjektiivi naisille kaikissa maailman kirjallisuus, joka on täysin sopusoinnussa yleisen yksiulotteisia naisten edustus monissa muissa median muodoissa. Jos joku haluaa tehdä lisätutkimusta tästä, kerro minulle ja voin antaa sinulle paljon enemmän tietoa (esimerkiksi, on noin 25000 eri merkinnät ”nainen” – liian monet näyttää täällä).
tulosten sinisyys kuvaa niiden suhteellista esiintymistiheyttä. Voit leijua kohteen yli sekunnin ja taajuuspisteen pitäisi ponnahtaa ylös., ”Ainutlaatuisuus” lajittelu on oletusarvo, ja kiitos minun monimutkainen algoritmi™, se määrää ne adjektiivien ainutlaatuisuus kyseiselle substantiiville suhteessa muihin substantiiveihin (se on itse asiassa melko yksinkertainen). Kuten odottaa, voit klikata ”Lajittele käyttötaajuudella” – painiketta adjektiiveja niiden käyttötaajuudella kyseiselle substantiiville.