Сунъий интеллект саволларга жавоб беришда манбаларни қаердан олади?
Statista ва Semrush маълумотларига кўра, катта тил моделлари билимларининг катта қисми Reddit, Wikipedia ва YouTube каби очиқ платформалар орқали шаклланмоқда. Бу тенденция дезинформация ва тарафкашлик хавфини оширишини таъкидламоқда.

Statista ва Semrush томонидан 2025 йил июнь ойида эълон қилинган қўшма тадқиқот сунъий интеллект тизимлари энг кўп фойдаланадиган доменлар ва ахборот манбаларини аниқлаб берди.
Катта тил моделлари (LLM) бугунги кунда ахборот технологиялари соҳасида туб ўзгаришларни бошлаб бермоқда. Улар қидирув тизимлари, таҳлилий платформалар, мижозларга хизмат кўрсатиш ва контент яратиш каби кўплаб йўналишларда фаол қўлланилмоқда. Бироқ бу моделларнинг аниқлиги ва ишончлилиги бевосита улар ўқитилган маълумотлар сифати билан белгиланади.
Tahlil shuni ko‘rsatadiki, katta til modellari akademik yoki yuqori darajada ixtisoslashgan bazalarga qaraganda, ochiq internet va ijtimoiy platformalarga ancha ko‘proq tayanadi. Ma’lumotlar oqimining asosiy qismi uchta yirik manba atrofida jamlangan.
Reddit — 40,1 фоиз
Энг катта улуш — 40,1 фоиз билан Reddit платформасига тўғри келади. Бу форумлар AI учун жамоавий фикрлаш, жонли мулоқот, оғзаки нутқ услублари ва реал ҳаётий вазиятларга оид тажрибалар манбаи ҳисобланади. Моделлар кўплаб контекстуал ечимларни айнан фойдаланувчилар ўртасидаги муҳокамалар орқали ўзлаштиради.
Wikipedia — 26,3 фоиз
Иккинчи ўринда 26,3 фоиз улуш билан Wikipedia туради. Ушбу платформа структураллашган энциклопедик билимлар, тарихий фактлар ва илмий тушунчалар бўйича асосий таянч манба бўлиб хизмат қилади. Пеэр-модерация механизми мавжуд бўлса-да, унинг очиқлиги айрим ҳолларда баҳсли маълумотларнинг ҳам сақланиб қолишига сабаб бўлади.
YouTube — 23,5 фоиз
Учинчи йирик манба — 23,5 фоиз улушга эга YouTube. Видео контентларнинг транскрипсиялари орқали AI турли қўлланмалар, тушунтиришлар ва амалий йўриқномалардан иборат катта ҳажмдаги маълумотларни қайта ишлайди. Бу эса моделларни “қандай қилиш керак” типидаги саволларда нисбатан кучли қилади.
Топ-10 рўйхатга, шунингдек, Google қидирув натижалари, Yelp ва Амазонъдаги истеъмолчи шарҳлари, Фаcебоокъдаги ижтимоий мунозаралар, ТрипАдвисорънинг туризмга оид контенти ҳамда Mapbox ва OpenStreet каби геолокатсион платформалар киради. Ушбу манбалар AI’га бозор талаби, жамоатчилик кайфияти ва ҳудудий маълумотлар бўйича кенг тасаввур беради.
| Манба | Улуш (%) | Маълумот тури ва аҳамияти | |
| 1 | 40.1 | Субъектив тажрибалар, жонли муҳокамалар, ижтимоий ва маданий тенденциялар | |
| 2 | Wikipedia | 26.3 | Структуралашган энциклопедик билимлар, тарихий ва илмий фактлар |
| 3 | YouTube | 23.5 | Видео транскрипциялари орқали таълимий ва тушунтирувчи контент |
| 4 | 23.3 | Қидирув натижалари, snippet’лар ва умумий ахборот рейтинглари | |
| 5 | Yelp | 21.0 | Истеъмолчи шарҳлари, хизматлар сифати ва фойдаланувчи тажрибаси |
| 6 | 20.0 | Ижтимоий гуруҳлар, жамоатчилик фикри ва оммавий муҳокамалар | |
| 7 | Amazon | 18.7 | Маҳсулот тавсифлари, бозор талаби ва харидор фикрлари |
| 8 | TripAdvisor | 12.5 | Туризм ва меҳмондўстлик соҳасига оид тажрибавий маълумотлар |
| 9 | Mapbox | 11.3 | Географик жойлашув, хариталар ва навигация маълумотлари |
| 10 | OpenStreetMap | 11.3 | Очиқ кодли геолокация ва ҳудудий ахборот ресурслари |
Манбаларнинг бундай тақсимоти бир қатор муаммоларга олиб келади
Бироқ маълумотлар таркибининг бундай тузилиши бир қатор тизимли хавфларни юзага чиқаради. Энг асосий муаммо — дезинформация ва тарафкашликдир. Reddit ёки Facebook каби платформаларда субъектив фикрлар, текширилмаган даъволар ва миш-мишлар кенг тарқалган бўлиб, AI уларни етарли фильтрациясиз қабул қилиши мумкин. Натижада моделлар нохолис ёки нотўғри хулосаларга келиш эҳтимоли ошади.
Яна бир муҳим хатар — ваколатли манбалар улушининг пастлигидир. Масалан, Amazon ёки Елпъдаги шарҳлар истеъмолчи тажрибасини акс эттиради, бироқ улар илмий ёки профессионал экспертиза билан мустаҳкамланмаган. Бу ҳолат тиббиёт, ҳуқуқ ёки молия каби юқори аниқлик талаб этиладиган соҳаларда жиддий хатоларга олиб келиши мумкин.
Шунингдек, ижтимоий тармоқларга хос “акс садо эффекти”, яъни оммабоп, аммо нотўғри қарашларнинг устунлик қилиши AI алгоритмларига ҳам сингиб қолиш хавфини туғдиради. Бу эса билимларнинг мувозанатсиз ва тор доирадаги қарашлар асосида шаклланишига олиб келади.
Нима қилиш керак?
Экспертлар фикрича, сунъий интеллект ривожининг кейинги босқичи “катта маълумотлар”дан “ишончли маълумотлар”га ўтиш билан тавсифланади. Келажакда моделларни ўқитишда сараланган, текширилган ва ихтисослашган маълумотлар тўпламларига устуворлик берилиши кутилмоқда. Булар қаторига илмий журналлар, қонунчилик базалари, тиббий протоколлар ва ички корпоратив ҳужжатлар киради.
Бундан ташқари, ахборот манбасининг келиб чиқишини ва ишончлилигини тасдиқловчи верификация механизмлари, жумладан, блокчейн асосидаги ечимлар жорий этилиши эҳтимоли юқори. Шу билан бирга, AI моделлари фойдаланадиган маълумотлар шаффофлигини таъминлашга қаратилган регулятив талаблар ҳам кучайиб боради.









