Beschreiben von Wörtern
Die Idee für die beschreibende Wörter-Engine kam, als ich die Engine für verwandte Wörter baute (es ist wie ein Thesaurus, gibt Ihnen aber einen viel breiteren Satz verwandter Wörter als nur Synonyme). Während ich mit Wortvektoren und der „HasProperty“ – API von conceptnet herumspielte, hatte ich ein bisschen Spaß daran, die Adjektive abzurufen, die üblicherweise ein Wort beschreiben. Irgendwann wurde mir klar, dass es einen viel besseren Weg gibt: Bücher analysieren!,
Project Gutenberg war der erste Korpus, aber der Parser wurde gieriger und gieriger und ich fütterte ihn irgendwo mit 100 Gigabyte Textdateien – hauptsächlich Fiktion, einschließlich vieler zeitgenössischer Werke. Der Parser schaut einfach durch jedes Buch und zieht die verschiedenen Beschreibungen von Substantiven heraus.,
Hoffentlich ist es mehr als nur eine Neuheit und einige Leute werden es tatsächlich nützlich für ihr Schreiben und Brainstorming finden, aber eine nette kleine Sache zu versuchen ist, zwei Substantive zu vergleichen, die ähnlich sind, aber sich in gewisser Weise unterscheiden – zum Beispiel Geschlecht ist interessant: „Frau“ versus „Mann“ und „Junge“ versus „Mädchen“. Auf einer initalen schnellen Analyse scheint es, dass Autoren von Fiktion mindestens 4x wahrscheinlicher sind, Frauen (im Gegensatz zu Männern) mit schönheitsbezogenen Begriffen (in Bezug auf ihr Gewicht, Eigenschaften und allgemeine Attraktivität) zu beschreiben., Tatsächlich ist „schön“ möglicherweise das am weitesten verbreitete Adjektiv für Frauen in der gesamten Weltliteratur, was der allgemeinen unidimensionalen Darstellung von Frauen in vielen anderen Medienformen entspricht. Wenn jemand weitere Nachforschungen anstellen möchte, lassen Sie es mich wissen und ich kann Ihnen viel mehr Daten geben (zum Beispiel gibt es ungefähr 25000 verschiedene Einträge für „Frau“ – zu viele, um sie hier anzuzeigen).
Die Bläue der Ergebnisse stellt Ihre relative Häufigkeit. Sie können für eine Sekunde über ein Element schweben und die Frequenz Punktzahl sollte Pop-up., Die Sortierung „Eindeutigkeit“ ist standardmäßig und ordnet sie dank meines komplizierten Algorithmus™ anhand der Eindeutigkeit der Adjektive für dieses bestimmte Substantiv relativ zu anderen Substantiven an (es ist eigentlich ziemlich einfach). Wie zu erwarten, können Sie auf die Schaltfläche „Nach Verwendungshäufigkeit sortieren“ klicken, um Adjektive nach ihrer Verwendungshäufigkeit für dieses Substantiv zu sortieren.