Nosaukto entītiju atpazīšana ir informācijas ieguves apakšuzdevums, kura mērķis ir atrast un klasificēt nosauktās entītijas, kas minētas nestrukturētā tekstā iepriekš noteiktās kategorijās, piemēram, personu vārdi, organizācijas, atrašanās vietas, medicīniskie kodi, laika izteiksmes, daudzumi, naudas izteiksmes. vērtības, procenti utt.
Ko dara nosauktās entītijas atpazīšana?
Nosaukto entītiju atpazīšana ir dabiskas valodas apstrādes paņēmiens, kas var automātiski skenēt veselus rakstus un izvilkt dažas pamata entītijas tekstā un klasificēt tās iepriekš noteiktās kategorijās.
Ko sauc par entītiju atpazīšanu, paskaidrojiet ar piemēru palīdzību?
Nosaukto entītiju atpazīšana (NER) palīdz viegli identificēt galvenos teksta elementus, piemēram, cilvēku vārdus, vietas, zīmolus, naudas vērtības un daudz ko citu. Teksta galveno entītiju izvilkšana palīdz kārtot nestrukturētus datus un noteikt svarīgu informāciju, kas ir ļoti svarīgi, ja jums ir jāstrādā ar lielām datu kopām.
Kur tiek izmantota nosauktā entītiju atpazīšana?
Nosauktās entītijas atpazīšana var automātiski skenēt veselus rakstus un atklāt, kuri ir galvenie tajos apspriestie cilvēki, organizācijas un vietas. Zinot atbilstošos tagus katram rakstam, tas palīdz automātiski klasificēt rakstus noteiktās hierarhijās un nodrošināt vienmērīgu satura atklāšanu.
Kā izveidot nosauktu entītijas atpazīšanu?
- Pievienojiet entītijai jauno entītijas iezīmiatpazinējs, izmantojot metodi add_label.
- Apskatiet piemērus un izsauciet nlp. atjauninājums, kurā tiek ievadīti ievades vārdi. Pie katra vārda tas sniedz pareģojumu. …
- Saglabājiet apmācīto modeli, izmantojot nlp. uz_disku.
- Pārbaudiet modeli, lai pārliecinātos, ka jaunā entītija ir atpazīta pareizi.