۰۳ بهمن ۱۳۹۵ - ۱۳:۲۹

۷۰ درصد وب فارسی تکراری و بی‌محتواست

رئیس پژوهشگاه IT مرکز تحقیقات مخابرات گفت: نتایج جستجوی صفحات فارسی توسط جستجوگرهای بومی نشان می‌دهد 30 درصد صفحات فارسی دارای محتوای خوب و 70 درصد دارای محتوای تکراری یا بدون محتوا است.
کد خبر : ۳۴۵۳۵۲
صراط: رئیس پژوهشگاه IT مرکز تحقیقات مخابرات گفت: نتایج جستجوی صفحات فارسی توسط جستجوگرهای بومی نشان می‌دهد 30 درصد صفحات فارسی دارای محتوای خوب و 70 درصد دارای محتوای تکراری یا بدون محتوا است.

به گزارش فارس،‌ علیرضا یاری در نشست خبری همایش بررسی راهکارهای پیشگیری از سرقت علمی، اظهار داشت: در سال‌های اخیر که زبان روسی چند صد میلیون صفحه در اینترنت داشت مجموع  تمامی صفحات فارسی در اینترنت به یک میلیون صفحه نیز نمی‌رسید اما اکنون موتور جستجوهای ایرانی از جمله پارسی‌جو 4 میلیارد صفحه فارسی در اینترنت را جستجو کرده‌اند.

رئیس پژوهشگاه فناوری اطلاعات مرکز تحقیقات مخابرات با بیان اینکه رشد صفحات فارسی در وب بسیار زیاد است اما کیفیت محتوای فارسی‌ چندان مطلوب نیست، گفت: روند سریع رشد محتوای سرقت علمی را با اهمیت‌تر کرده است.

یاری با بیان اینکه اکنون مردم بیش از رسانه‌ها محتوا تولید می‌کنند، گفت: از هم اکنون که توسعه محتوای فارسی شدت گرفته می‌توانیم درباره تولید محتوای سالم فرهنگ‌سازی کنیم.

به گفته وی نتایج جستجوی صفحات فارسی توسط جستجوگرهای بومی نشان می‌دهد 30 درصد محتوای فارسی در وب محتوای خوب و 70 درصد محتوای تکراری یا بدون محتوا است و بیشتر کپی کاری‌ها از منابع  خبرگزاری‌ها در وبلاگ‌ها انجام می‌شود.

در ادامه این همایش حبیب‌الله اصغری پژوهشکده فناوری اطلاعات و ارتباطات جهاد دانشگاهی اظهار داشت: سوء رفتار علمی بیشتر در محیط‌ آکادمیک رخ می‌دهد که تغییر داده‌ دیگران بدون بن‌مایه علمی، انجام معامله، افزودن نام نویسنده‌ای که کمکی در نگارش نداشته و انتشار چند باره یک مقاله بدون ایجاد تغییر از مصادیق سوء رفتارهای علمی است.

وی از وجود 4 سیستم تشخیص سرقت علمی در ایران خبر داد و گفت: سیستم مهتاب در دانشگاه شهید بهشتی، سیستم سمیم نور در مرکز کامپیوتری علوم انسانی نور، سیستم همانندجو در پژوهشگاه علوم و فناوری وزارت علوم (ایران داک) با تمرکز بر پایان‌نامه‌ها و سیستم همتاجو در مرکز اطلاعات علمی جهاد دانشگاهی با تمرکز بر مقالات از ابزارهای فناوری اطلاعات برای تشخیص علمی استفاده می‌کنند.

وی گفت: ابزارهای تشخیص سرقت علمی بر پایه مشابهت‌یابی استوار هستند و با الگوریتمی شباهت متن‌های موجود را بررسی می‌کنند.

به گفته وی، همواره این سوال مطرح است که آیا سرقت ادبی نیز در زمره سرقت علمی به شمار می‌آید که بسیاری معتقدند که سرقت ایده، سرقت علمی است و سرقت شیوه سرقت علمی محسوب نمی‌شود.

اصغری با اشاره به اینکه بسیاری از کاربران از مصادیق سرقت علمی آگاهی ندارند، گفت: برخی تصور می‌کنند در باز نشر مطلبی (واقعی یا غیرواقعی) اگر منبع ذکر شود ایرادی ندارد در حالی که این اقدام می تواند در برخی موارد مصداق سرقت علمی باشد.

اصغری گفت: اجباری شدن درس روش تحقیق، آشنایی با شیوه پایان‌نامه و مقالات، مرام‌نامه‌های اخلاقی و ابزارهای فناوری اطلاعات تشخیص سرقت علمی از راهکارهای برخورد با سرقت علمی است.

همایش بررسی راهکارهای پیشگیری از سرقت علمی با محوریت سوء رفتارهای علمی و سرقت علمی ششم بهمن‌ماه در تهران برگزار می‌شود.
برچسب ها: صراط اینترنت