Берилиштердин интеллектуалдык боюнча жиктөө

Classification тагыраак божомолдорун жана талдоо боюнча жардам үчүн маалымат чогултуу, категорияларды тапшырган маалымат тоо-кен казып алуу ыкмасы болуп саналат. Ошондой эле кээде чечим дарагы деп атады, классификация өтө чоң берилиштер талдоо натыйжалуу үчүн арналган бир нече ыкмаларынын бири болуп саналат.

Эмне үчүн Classification?

Абдан чоң базасы азыркы дүйнө боюнча норма болуп, "чоң маалыматтар." Маалыматтар биригип терабайт бир нече терабайттык менен базасы маалыматтарды бир триллион байт бар дейли.

Facebook гана ар бир күнү жаңы маалыматтарды 600 терабайттаган crunches (2014-жылдын ошондой эле, акыркы жолу бул мүнөздөмөлөрүн билдирди). чоң маалыматтардын негизги маселе аны түшүнүү үчүн керек болот.

Ал эми канчалык бир гана маселе эмес, чоң маалыматтар, ошондой эле ар түрдүү, бонитети жана тез алмаштырыш үчүн кылат. үн жана көрмө маалыматтарды, коомдук медиа билдирүүлөрүн, 3D маалыматтарды же Геомейкиндиктик маалыматтарды карап көрөлү. маалыматтардын ушундай жонокой категориясына же уюштурулган эмес.

Бул чакырыкка жооп берүү үчүн, пайдалуу маалыматтарды алуу үчүн автоматтык ыкмаларын бир катар алардын арасында классификация, иштелип чыккан.

Кантип Classification Works

өтө алыс технологиялуу-сүйлөбөгүлө көчүп коркунучу боюнча, анын классификация кандай иштегенин карап көрөлү. максат, бир суроого жооп берет классификация эрежелеринин комплексин түзүү жөнүндө чечим кабыл алат же behavior.To баштоого алдын ала болуп саналат, окуу маалыматтардын жыйындысы, ошондой эле, кыязы, жыйынтыгы сыпаттарынын бир топтомун камтыган иштелип жатат.

классификация Алгоритмдин жумуш сыпаттарын белгиленген корутунду жеткен кантип табууга болот.

-Жагдай: Балким, кредиттик карта компания келечеги кредиттик карта сунушун кабыл керектигин аныктоо үчүн аракет кылып жатат.

Бул тренинг маалыматтарды, анын топтому болушу мүмкүн:

окутуу маалыматтар
ысым Жашы Калаасы Жылдык киреше Кредит карта сунуш
Джон Доу 25 M $ 39.500 Жок
Jane Доу 56 F $ 125,000 Ооба

"Божомолдоолордун" мамычалар жашта, гендердик жана жылдык киреше "божомолдоолордун атрибуттуу" Кредиттик карта сунушунун маанисин аныктоо. окутуу комплекске, божомолдоолордун сыпат белгилүү. классификация алгоритми анда божомолдоолордун атрибуту наркы жетишилген кантип аныктоого аракет кылат: божомолдоочу жана чечим ортосунда кандай мамиле? Мисалы үчүн, адатта, IF / АНАН билдирүүсүндө, алдын ала эрежелери комплексин иштеп чыгат:

IF (Жашы> 18 ЖЕ Жашы <75) жана жылдык киреше> 40,000 АНАН Кредиттик карта сунуш = ооба

Албетте, бул жөнөкөй мисал, алгоритм жерде көрсөтүлгөн эки эсепке караганда, алда канча көбүрөөк маалыматтар алынышы керек. Андан тышкары, алдын ала эрежелери бар атрибуттуу маалымат басып суб-эрежелерин, анын ичинде, алда канча татаал болушу мүмкүн.

Кийинки, алгоритм талдоо маалыматтар бир "алдын ала топтомун" берилген, бирок бул топтому алдын касиетти (чечим) жок:

божомолдоолордун маалыматтар
ысым Жашы Калаасы Жылдык киреше Кредит карта сунуш
Аяз 42 M $ 88,000
Мюррей 16 F $ 0

Бул божомолдоолордун маалыматтар алдын ала эрежелерин так аныктоого жардам берет, жана эрежелер анда иштеп божомолдорун натыйжалуу жана пайдалуу деп эсептеген чейин tweaked жатат.

Бөлүү күнү үлгү Day

Классификация, жана башка маалымат-кен техникасын, артында керектөөчүлөрдүн катары күн сайын тажрыйбасы көп.

Аба ырайы божомолдору күнү жаан-чачындуу, күнөстүү жана жаан-чачын болбойт, жокпу, отчет жашыруун пайдаланууга мүмкүн. медициналык кесип медициналык жыйынтыктарын алдын ала сактоо шарттарды талдоо мүмкүн. бөлүү методдорунан, Тажрыйбасыз технологияны аялдар эркектер менен бөлүшпөйт бир түрү, спам электрондук каттарын категорияга үчүн шарттуу ыктымалдыгы колдонот. өндүрүм сунуштары менен алдамчылык аныктоо тартып, классификация көшөгөнүн артында күн сайын маалыматтарды анализдөө жана алдын ала өндүрүүчү болуп саналат.