Icon

Website Boosting 78 - NER

Named Entity Recogniton- Unstruktiruerte Daten (z.B. die Descriptions aus einem Screaming Frog Crawl) werden auf Entitäten analysiert- Dazu wird ein Modell von SpaCy verwendet (https://spacy.io/models/de)- Optional können die Entitäten via SERP API mit dem Google Knowledge Graphen abgeglichen werden. Daduch können unterschiedliche Scheibweisen einer Entität zusammengefasst werden Daten Importieren Daten analyiseren Daten aufbereiten SERP API abfragen Daten visualisieren API Schlüssel nötig z.B. von https://serpapi.comTexte importieren(z.B. Meta Descriptionaus einem Screaming FrogCrawl)Sprachmodellladen (aufdie richtigeSprache achten)Tokenizing derTexte( Wichtig: korrekte Spalte die analysiert werdensoll auswählen)Entitäten ErkennungToken in einzelneZellen vom Typ "Term" schreibenZählen, wie häufig jederTerm im DokumentvorkommtEntitätstyp in eigeneSpalte schreiben: Spalte Term auswählen und SPACY_NETerm in eigeneSpalte schreibenNach Term gruppierenTerme, für die keine Entität gefunden wurdeherausfilternNach vorkommenabsteigend sortierenEntitäten als Tag CloudvisualisierenNeue Spalte mitEntität im UTF-8Format erstellenURL der SERP-APIeintragenOptionalNur Entitätenverwenden, die mindestens2x vorkommen,um Daten zu sparenSpalten so sortieren, dassAPI-URL vor Term as String (Endoced) stehtAPI-URL mitEntität als Query-Parameter verbindenSERP-APIabfragen ($)- Delay und Timeouthochsetzen- Abfrage kann längerdauernWerte aus den JSON-Daten extrahierenSpalten neuSortierenNicht mehr benötigteSpalten herausfilternNach KG Title undKG Type gruppierenEntitäten als TabellevisualisierenCSV Reader Spacy ModelSelector Spacy Tokenizer Spacy NER Bag Of WordsCreator DF Tags To String Term To String GroupBy Row Filter Sorter Tag Cloud URL Encode ConstantValue Column Row Filter Column Resorter Column Aggregator GET Request JSON Path Column Resorter Column Filter GroupBy Table View Named Entity Recogniton- Unstruktiruerte Daten (z.B. die Descriptions aus einem Screaming Frog Crawl) werden auf Entitäten analysiert- Dazu wird ein Modell von SpaCy verwendet (https://spacy.io/models/de)- Optional können die Entitäten via SERP API mit dem Google Knowledge Graphen abgeglichen werden. Daduch können unterschiedliche Scheibweisen einer Entität zusammengefasst werden Daten Importieren Daten analyiseren Daten aufbereiten SERP API abfragen Daten visualisieren API Schlüssel nötig z.B. von https://serpapi.comTexte importieren(z.B. Meta Descriptionaus einem Screaming FrogCrawl)Sprachmodellladen (aufdie richtigeSprache achten)Tokenizing derTexte( Wichtig: korrekte Spalte die analysiert werdensoll auswählen)Entitäten ErkennungToken in einzelneZellen vom Typ "Term" schreibenZählen, wie häufig jederTerm im DokumentvorkommtEntitätstyp in eigeneSpalte schreiben: Spalte Term auswählen und SPACY_NETerm in eigeneSpalte schreibenNach Term gruppierenTerme, für die keine Entität gefunden wurdeherausfilternNach vorkommenabsteigend sortierenEntitäten als Tag CloudvisualisierenNeue Spalte mitEntität im UTF-8Format erstellenURL der SERP-APIeintragenOptionalNur Entitätenverwenden, die mindestens2x vorkommen,um Daten zu sparenSpalten so sortieren, dassAPI-URL vor Term as String (Endoced) stehtAPI-URL mitEntität als Query-Parameter verbindenSERP-APIabfragen ($)- Delay und Timeouthochsetzen- Abfrage kann längerdauernWerte aus den JSON-Daten extrahierenSpalten neuSortierenNicht mehr benötigteSpalten herausfilternNach KG Title undKG Type gruppierenEntitäten als TabellevisualisierenCSV Reader Spacy ModelSelector Spacy Tokenizer Spacy NER Bag Of WordsCreator DF Tags To String Term To String GroupBy Row Filter Sorter Tag Cloud URL Encode ConstantValue Column Row Filter Column Resorter Column Aggregator GET Request JSON Path Column Resorter Column Filter GroupBy Table View

Nodes

Extensions

Links