beskriva ord
idén för beskrivande ord motorn kom när jag byggde motorn för relaterade ord (det är som en synonymordbok, men ger dig en mycket bredare uppsättning relaterade ord, snarare än bara synonymer). Medan jag spelade runt med ordvektorer och” HasProperty ” API för conceptnet, hade jag lite roligt att försöka få adjektiven som vanligtvis beskriver ett ord. Så småningom insåg jag att det finns ett mycket bättre sätt att göra detta: tolka böcker!,
projektet Gutenberg var den ursprungliga corpus, men tolken blev girigare och girigare och jag slutade mata den någonstans runt 100 gigabyte textfiler – mestadels fiktion, inklusive många samtida verk. Tolken ser helt enkelt igenom varje bok och drar ut de olika beskrivningarna av substantiv.,
förhoppningsvis är det mer än bara en nyhet och vissa människor kommer faktiskt att finna det användbart för deras skrivning och brainstorming, men en snygg liten sak att försöka är att jämföra två substantiv som är likartade, men olika på något betydande sätt – till exempel är kön intressant: ”kvinna” mot ”man” och ”pojke” mot ”tjej”. På en inital snabb analys verkar det som att Författare av fiktion är minst 4x mer benägna att beskriva kvinnor (i motsats till män) med skönhetsrelaterade termer (när det gäller deras vikt, egenskaper och allmän attraktivitet)., Faktum är att” Vacker ” möjligen är det mest använda adjektivet för kvinnor i hela världens litteratur, vilket är helt i linje med den allmänna unidimensionella representationen av kvinnor i många andra medieformer. Om någon vill göra ytterligare forskning om detta, låt mig veta och jag kan ge dig mycket mer data (till exempel finns det cirka 25000 olika poster för ”kvinna” – för många att visa här).
resultatens blueness representerar deras relativa frekvens. Du kan sväva över ett objekt för en sekund och frekvenspoängen ska dyka upp., Sorteringen” unikhet ” är standard, och tack vare min komplicerade algoritm™ beställer den dem av adjektivens unika karaktär till det specifika substantivet i förhållande till andra substantiv (det är faktiskt ganska enkelt). Som du förväntar dig kan du klicka på knappen ”Sortera efter användningsfrekvens” till adjektiv genom deras användningsfrekvens för det substantivet.