Tikk Domonkos (szerk.)

Szövegbányászat

A szövegbányászat célja, hogy a szöveges formában - interneten, szöveges adatbázisokban, vállalati intraneteken vagy személyi számítógépeken - tárolt, azaz jellemzően strukturálatlan elektronikus adatokból a rejtett, nem triviális információkat felderítse, illetve a hozzáadott információkat kinyerje. Mivel az elektronikus formában tárolt adatok egyre növekvő hányadát a szöveges dokumentumok teszik ki (a Merill Lynch elemzői szerint az üzleti információk 85%-a strukturálatlan adat: e-mail, emlékeztető, üzleti és kutatási beszámoló, prezentáció, hírek, reklámanyag, weboldal stb.), ezért egyre nagyobb igény van olyan megoldásokra, amelyekkel hatékonyan lehet szövegeket intelligens módon feldolgozni és elemezni.

 

A könyv a következő témákat tárgyalja:


– előfeldolgozás, modellalkotás, reprezentáció;
– információkinyerés;
– osztályozás;
– csoportosítás;
– kivonatolás;
– internetes keresés;
– válaszkereső rendszerek;
– piaci alkalmazások.

 

Mivel a szövegbányászati problémák nagy része nyelvfüggő, ezért a mű külön foglalkozik a magyar nyelvű szövegek feldolgozását segítő módszerekkel és eredményekkel, amivel a hazai piaci igények kielégítését is elő kívánja segíteni.

Ez a honlap a könyv internetes melléklete, amelyen a könyv anyagához kapcsolódó kiegészítések (példák, esettanulmányok, kapcsolódó anyagok), a könyv linkekkel kiegészített irodalomjegyzéke, további hasznos forrásokat tartalmazó linkgyűjtemény, valamint a könyvvel és a szövegbányászattal kapcsolatos egyéb információk találhatók.


A könyv megvárásolható online az Olvasók Klubjában 20%-os kedvezménnyel.