فناورانه
۳ اسفند ۱۴۰۴
بدون دیدگاه
فساد, کاربرد های هوش مصنوعی, کشف فساد, مقابله با فساد, هوش مصنوعی

داستان هوش مصنوعی

الگوریتم مرگ موش؛ درآمدی بر ریشه‌کن کردن فساد در ایران به روش هوشمند

دکتر خلیل سجاد

دکتر خلیل سجاد

عضو هیئت مدیره و مدیر فناوری و توسعه

شرکت مهندسی بین المللی فولاد تکنیک

دکتر خلیل سجاد

در بخش پایانی از داستان هوش مصنوعی به یکی از کاربردهای مهم این روش به‌روز حل مسئله و آنچه که بزرگ‌ترین مشکل امروز اقتصاد کشور است، یعنی فساد پرداخته می‌شود و تلاش می‌گردد تا سناریوهای مختلف شکل‌گیری آن، بررسی و الگوریتم ترکیبی هوش مصنوعی در کشف فساد، طراحی گردد.

در کشورهای مختلف جهان در سال‌های اخیر، مطالعاتی انجام شده و روش‌های کشف فساد مبتنی بر هوش مصنوعی توسعه داده شده است که در یک بررسی اجمالی در بسیاری از این کشورها، از فرار مالیاتی به عنوان یکی از بزرگ‌ترین تخلف‌ها نام برده شده

اما شرایط کشورهای مختلف با شرایط ایران متفاوت است.

درست است که فرار مالیاتی در ایران نیز به عنوان یکی از مصادیق فساد قابل طرح و بررسی‌ست اما اَشکال مختلف فساد در کشورمان، آنچنان متنوع و پیچیده‌اند که در کمتر کشوری می‌توان این سطح از گستردگی را مشاهده کرد و همین شرایط ویژه و منحصر به فردِ ایران، راه حل‌های مبارزه با فساد را نیز منحصر به فرد می‌کند.

در موضوع مشخص فرار مالیاتی، ساختار اقتصادی کشور به گونه‌ای ست که ۲۰ درصد اقتصاد در اختیار دولت، ۶۰ درصد در اختیار خصولتی‌ها و تنها ۲۰ درصد آن در دست بخش خصوصی واقعی‌ست و یکی از بزرگ ترین مشکلات اقتصاد کشور، در فرار مالیاتی این خصولتی ها ست. [1و2] غول پرسه‌زن بی‌بازده – قسمت اول و غول پرسه‌زن بی‌بازده – قسمت دوم

در ماده ۴۴ قانون اساسی در رابطه با خصوصی‌سازی و اصلاحیه‌ی آن در سال ۱۳۹۹ ضوابطی در خصوص اعلام صورت‌های مالی در کُدال و در دسترس قرار گرفتن آن برای عموم مردم آمده است؛ ولی چنانکه به‌روشنی در مقاله‌ی غول پرسه‌زن بی‌بازده [۱ و ۲] آمده است تنها بخش بسیار کوچکی از این خصولتی‌ها یا حکومتی‌ها، آن هم در بازه‌ی زمانی کوتاهی، این اطلاعات را منتشر کرده‌اند و البته از همان مختصر اطلاعات فاش شده به روشنی می‌توان چهره‌ی واقعی خصولتی‌ها و علت عدم انتشار بیشترِ اطلاعات را حدس زد.

بهره‌وری و ساختار درآمد و هزینه و بسیاری دیگر از اطلاعات موجود در این صورت‌های مالی، از ناکارایی بسیار بالای این بخش عمده‌ی اقتصاد کشور حکایت می‌کند و در این میان، فرارهای مالیاتی نیز به وضوح به چشم می‌خورد. بنابراین تا اراده‌ای در حاکمیت مبنی بر پاسخگو کردن این خصولتی‌ها یا واگذاری کامل آنها به بخش خصوصی واقعی مشاهده نگردد، ورود به مسئله‌ی فرار مالیاتیِ ۲۰ درصد اقتصاد خصوصی واقعی در این مقاله، ظلمی‌ست مضاعف بر این بخش ستمدیده‌ی اقتصاد، از طرفی حاکمیت با توجه به تحریم‌های بین‌المللی و مشکل بزرگ کاهش منابع، آن‌چنان با استفاده از ابزارهای مختلف، اخذ مالیات بخش خصوصی را در سال‌های اخیر گسترش داده است که استفاده از روش‌های مبتنی بر هوش مصنوعی در پرداخت مالیات، ظلمی‌ست بزرگ بر این بخش و بنابراین از مصادیق طرح شده در این مقاله خارج می‌گردد و به دیگر سناریوهای فساد منحصربه‌فرد ایران که کمتر به آنها توجه شده، پرداخته خواهد شد.

در تاریخ 7 اسفند 1403، معاون هماهنگی و پیگیری نهاد ریاست جمهوری با اشاره به وجود ۷۴ هزار پروژه‌ی ناتمام در کشور اظهار کرد: «برای تکمیل این پروژه‌ها به ۴۸۰۰ همت اعتبار و ۴۴ سال زمان نیاز است که این عدد با توجه به نرخ دلار در اسفند ۱۴۰۳، معادل 60 میلیارد دلار است».

یکی از بزرگ‌ترین مسیرهای شکل‌گیری فساد در کشور، از دریافت مجوز احداث واحدهای صنعتی شروع می‌شود و احداث یک واحد صنعتی در نتیجه‌ی انجام مطالعات فنی-اقتصادی و پس از توجیه‌پذیری احداث آن واحد، آغاز می‌گردد و در این راستا، نقشه‌ی راه توسعه‌ی اقتصادی هر کشوری به عنوان چراغِ راهِ آغازِ این سرمایه‌گذاری، مورد استفاده قرار می‌گیرد که در این نقشه‌ی راه، شاخص‌های مختلفی مانند مزیت‌های رقابتی سرزمین، میزان نیاز به محصولات مختلف در داخل کشور، توجیه‌پذیری صادرات، محصولات استراتژیک مورد نیاز و … مورد تحلیل قرار می‌گیرد.

اکنون سال‌هاست که در برنامه‌های توسعه‌ی 5 ساله‌ی کشور، تدوین نقشه‌ی راه توسعه‌ی صنعتی به عنوان یک اولویت در دستور کار قرار گرفته است. اما متأسفانه، مشابه بسیاری دیگر از بندهای برنامه‌های توسعه، که نوشته شده است تا انجام نشود، تدوین مسیر توسعه‌ی صنعتی کشور نیز هنوز به شکلی جدی آغاز نشده است. در چنین شرایطی، سرمایه‌گذاری‌های صنعتی در کشور عمدتاً نه بر مبنای شاخص‌های واقعی توسعه، بلکه براساس استفاده از منابع ملی سرزمین، یارانه‌هایی که متعلق به عموم مردم است، در مسیر تخریب محیط زیست و در جهت سودجویی بخشی، انجام شده است.

در این نقطه است که هوش مصنوعی، در کنترل مجوزهای احداث واحدهای صنعتی به عنوان یکی از نقاط اصلی آغاز فساد در کشور، به کار گرفته می‌شود:

جهت احداث یک خط تولید، دریافت مجوزهای متعددی پیش‌بینی شده است که از ثبت نام و مجوزهای اولیه آغاز، و به دریافت پروانه‌ی بهره‌برداری و شروع تولید ختم می‌شود و برای اخذ هر مجوز، در حالت طبیعی مدت زمانی لازم است. پس مدت زمان دریافت هر مجوز، به‌عنوان اولین پارامترهای ورودی به الگوریتم هوش مصنوعیِ تشخیص‌دهنده‌ی فساد مورد نظر قرار می‌گیرد، چرا که اولین ریشه‌های فساد از همین مدت زمان‌های دریافت مجوز قابل شناسایی‌ست. طرح‌های عادی در زمانی نرمال و در بسیاری موارد، بیش از نرمال مورد بررسی قرار می‌گیرد و طرح‌های مسئله‌دار، با پرداخت رشوه به شیوه‌های گوناگون و یا از طریق ارتباطات پنهان، به‌سرعت بررسی و مجوز مربوطه بدون ضوابط قانونی، صادر می‌گردد.

در کنار مدت زمان اخذ مجوز، کارشناس بررسی‌کننده‌ی طرح نیز نقش تعیین کننده‌ای بازی می‌کند و مجموعه‌ی اطلاعات کارشناسان ادارات مرتبط که به گونه‌ای در فرآیند دریافت مجوزها نقش دارند، به عنوان ورودی های الگوریتم مورد توجه قرار می‌گیرند.
اما همه‌ی مجوزها، نقش بالایی در احداث یک خط تولید و در نهایت شکست یا موفقیت آن بازی نمی‌کنند و از بین آنها تعدادی نقش حیاتی دارند که در الگوریتم، باید به آنها توجه ویژه شود.
یکی از مهم‌ترین مجوزها، طرح توجیه فنی-اقتصادی پروژه و بررسی مطالعات بازار طرح مورد نظر است. این طرح‌ها از طریق مشاوران مورد تأیید نهادهای دولتی انجام می‌شود اما سهواً و یا عمداً اشتباهاتی در این مطالعات اتفاق می‌افتد که در میانه‌ی راه، طرح توجیه شده، به سرنوشت 60 میلیارد دلار پروژه‌های نیمه تمام دچار می‌شود. بنابراین به روش‌های مختلف، موارد زیر باید بررسی شود:
- به روز بودن تکنولوژی خط تولید؛
- قیمت درست خط تولید: در بسیاری موارد قیمت خط تولید، بالاتر اعلام می‌گردد تا بر اساس آن بتوان تسهیلات ویژه دریافت کرد و در برخی موارد، این قیمت به عمد پایین در نظر گرفته می‌شود تا توجیه‌پذیری کاذب ایجاد کند؛
- قیمت مواد اولیه و سرمایه در گردش؛
- قیمت انرژی؛
- قیمت فروش محصول؛
- بازار واقعی داخلی؛
- بازار واقعی خارجی؛
- فضای صادرات؛
- تعداد کارکنان مورد نیاز واقعی در خط تولید؛

…

حل مسئله‌ی کشف فساد در مجوزها به سه بخش زیر تقسیم می‌گردد:

راستی‌آزمایی مدارک درخواست مجوز؛
کشف مجوزهای صادر شده‌ی مشکوک به فساد؛
کشف شبکه‌ی فساد درگیر در صدور مجوزهای مشکوک؛

بخش اول: راستی‌آزمایی مدارک درخواست مجوز

بهترین روش اعتبارسنجی موارد فوق‌الذکر براساس یکی از روش‌های مبتنی بر هوش مصنوعی یعنیNLP [i]یا پردازش زبان طبیعی ست که لازم است تا بر مبنای مدل‌های زبانی بزرگ یا LLM [ii]های داخلی مبتنی بر سامانه‌ی دولت الکترونیک که اطلاعات پروژه‌های قبلی در آنهاست و نیز بر مبنای LLMهای بین‌المللی و قبل از شروع مراحل بعد، اعتبار اطلاعات طرح‌های توجیه فنی اقتصادی راستی‌آزمایی شود.

لازم به ذکر است که این مرحله نیز به صورت کاملاً مکانیزه انجام شده و تمام مدارک مورد نیاز دریافت مجوز که تا کنون بدان اشاره شد از جمله طرح توجیهی و مطالعات بازار و بررسی‌های محیط زیستی و … به عنوان ورودی یک سامانه‌ی مبتنی بر NLP در نظر گرفته شده و خروجی سامانه، نتیجه‌ی اعتبارسنجی مدارک طرح خواهد بود.

یکی از مزایای روش مبتنی بر NLP نسبت به روش‌های سنتی، کشف گزارش‌های غلط از گزارش‌های واقعی‌ست. متأسفانه بسیار دیده شده است که انواع گزارش‌های نادرستِ تهیه شده توسط مشاوران مختلف، به دلایل فراوان از جمله اصرار و فشار نمایندگان مجلس بر مشاور و بر نهادهای دولتی بر احداث کارخانه‌ای در نقطه‌ای از کشور که هیچ توجیهی ندارد، خسارت‌های جبران‌ناپذیری را بر پیکر اقتصاد کشور وارد کرده و ریشه‌ی اصلی 60 میلیارد دلار طرح نیمه تمام کنونی کشور شده است.

با استفاده از سامانه‌ی ماشینی مبتنی بر NLP جلوی این دسته از فساد های بزرگ گرفته می‌شود.

خروجی NLP پرونده‌های درخواست مجوز، به همراه پارامترهای زیر به‌عنوان ورودی‌های یک شبکه‌ی عصبی جدید در مرحله‌ی بعد در نظر گرفته می‌شود:

مدت زمان دریافت هر یک از مجوزها؛
میزان IRR طرح؛
امتیاز زیست‌محیطی؛
فاصله‌ی زمین تا شهر؛

بخش دوم: کشف مجوزهای صادر شده‌ی مشکوک به فساد

شبکه‌های عصبی از لحاظ روش یادگیری به 3 دسته‌ی تحت نظارت، بدون ناظر و تقویت‌شده تقسیم می‌شوند که در مواردی که اطلاعات آموزشی به معنای ورودی و خروجی مورد نظر در دست نیست، بهتر است از شبکه‌های با یادگیری بدون ناظر استفاده کنیم.

مسئله‌ی مورد نظر ما در بخش کشف فساد، از همین جنس است یعنی معمولاً مجموعه‌ی مناسبی (از نظر تعداد و کیفیت نمونه‌ها) از نمونه‌های کشف شده‌ی قبلیِ فساد در مجوزهای قبلیِ دریافت شده وجود ندارد، بنابراین لازم است که به‌تدریج پرونده‌های اخذ مجوز به سامانه وارد شده و به‌صورت بدون ناظر جداسازی لازم صورت پذیرد. بدین ترتیب با ورود هر پرونده، عملیات طبقه‌بندی به تدریج شکل گرفته و پرونده‌های درگیر فساد از پرونده‌های سالم جدا می‌گردد.

بدین منظور انواع مختلفی از شبکه‌های عصبی را می‌توان به کار گرفت که از مهم‌ترین و قدیمی‌ترین آنها، می‌توان به SVM [iii] اشاره کرد که به‌منظور دسته‌بندی نمونه‌های ورودی بدون نظارت استفاده می‌گردد. نمونه‌های عملی این شبکه‌ی عصبی در سال 1995 ارائه و در طول سال‌های گذشته توسعه یافته است. اما در جایی که الگوهای ورودی که در مثال مورد نظر ما، تعداد مجوزهای احداث کارخانه است، زیاد شود و با فرض اینکه نمونه‌های آلوده به فساد نسبت به نمونه‌های سالم، بسیار کمتر باشد (که امیدواریم اینگونه باشد) حجم محاسبات در SVM سنگین می‌شود و لازم است تا از روش‌های دیگر با سرعت بالاتر استفاده شود که یکی از این روش‌ها که اولین نسخه‌ی آن در سال 2008 ارائه شد و تا کنون به‌روزرسانی‌های فراوانی بر روی آن انجام شده و در یکی از نسخه‌های جدید آن، با الگوریتم یادگیری عمیق[iv] نیز ترکیب شده است، روش IF [v]است که امروزه به‌عنوان یک روش هوشمند استاندارد به منظور کشف فساد و کشف تقلب به کار گرفته می شود.

روش IF از لحاظ نوع الگوریتم آموزشی، بدون ناظر است ولی سرعت جداسازی الگوهایی که با بقیه متفاوتند، در آن بسیار بالاست. در مثال مورد نظر ما یعنی مجوزهای احداث خط تولید، هر سطر ماتریس ورودی به IF شامل یک مجوز خط تولید و هر ستون، یکی از ویژگی‌های مجوز است. به‌عنوان مثال سرعت اخذ هر مجوز به عنوان یک ویژگی در نظر گرفته می‌شود. سایر پارامترها شامل IRR، امتیاز محیط زیست، انرژی، آورده‌ی سرمایه‌گذار و … از دیگر ویژگی‌های هر مجوز است که برای هر مجوز در ستون‌های ماتریس قرار می‌گیرد.

جهت استفاده از کدهای آماده، از روش‌های مختلف می‌توان استفاده کرد که یکی از آنها توابع Python آماده است. نرم‌افزار محبوب دیگری که در اینگونه موارد استفاده می‌گردد، نرم‌افزار متلب[vi] است که در آن از تابع iforest می‌توان به‌سادگی با ورود ماتریس مجوزها و ویژگی‌های فوق‌الذکر به آن، مجوزهای مشکوک به فساد را جدا نمود و آن مجوزهای مشکوک را به منظور بررسی بیشتر و یافتن شبکه‌ی افراد فاسد به کار برد.

این مجوزهای مشکوکِ جدا شده، به عنوان ورودی شبکه‌ی عصبی دیگری مورد استفاده قرار می‌گیرد که در صورتی که ارتباطات افراد و شرکت‌ها مشخص باشند، بهترین کاندید، شبکه‌ی GNN [vii] است ولی با توجه به آنکه شبکه‌ی فساد به روش‌های گوناگون به مخفی کردن ارتباطات می‌پردازد، استفاده از GNN در این مرحله منتفی ست و با توجه به آنکه در بخش اول با استفاده از IF ، کل مجوزهای احداث کارخانه به مجوزهای مشکوک تبدیل شد، حجم اطلاعات ورودی به بخش سوم کاهش یافته و به‌گونه‌ای ست که ساختارهای مبتنی بر SVM برای تحلیل بخش سوم کافی و پر سرعت است.

بخش سوم: کشف شبکه‌ی فساد درگیر در صدور مجوزهای مشکوک

بدون ورود به جزییات، ساختارهای هوشمند مبتنی بر SVM جهت طبقه‌بندی اطلاعات استفاده می‌شود و در این بخش پایانیِ الگوریتم هوشمند، در پی آنیم که در مجوزهای مشکوکی که در خروجی IF شناسایی شده است، تمام عوامل دخیل در اخذ مجوز و ادامه‌ی فعالیت آن را در طول زمان به‌وسیله‌ی ماشین، بررسی و عوامل مرتبط با فساد، شناسایی و اعلام گردد: این عوامل که ورودی‌های SVM هستند، عبارتند از:

مجموع گردش حساب صادرکنندگان (و وابستگان آنها) مجوز احداث در بخش‌های مختلف نهادهای دولتی– به ازای هر شخص صادرکننده ی مجوز، یک ورودی SVM؛
مجموع دارایی صادرکنندگان (و وابستگان آنها) مجوز احداث در بخش‌های مختلف نهادهای دولتی– به ازای هر شخص صادرکننده‌ی مجوز، یک ورودی SVM؛
مجموع گردش حساب مالکان (و وابستگان آنها) مجوز احداث – به ازای هر مالک، یک ورودی SVM؛
مجموع دارایی مالکان (و وابستگان آنها) مجوز احداث – به ازای هر مالک، یک ورودی SVM؛
نسبت وام دریافتی بر روی مجوز احداث کارخانه به هزینه‌ی انجام شده در ساخت کارخانه؛
نسبت پیشرفت واقعی احداث خط تولید به پیشرفت برنامه‌ای آن؛
رتبه‌ی اعتباری واسطه‌ها یا تراستی‌ها در تراکنش‌های مربوط به پروژه؛
…

با تنظیم پارامترهای یادگیری SVM ، اطلاعات ورودی فوق در خروجی شبکه دسته‌بندی شده و با ورود دائمی اطلاعات ورودی و به روز شده در فواصل زمانی مشخص، می‌توان حرکت ورودی‌ها از دسته‌ای به دسته‌ی دیگر را مشاهده کرد. این تغییر دسته‌ها به معنای سیگنال‌های هشدار آغاز فساد در بخش یا بخش‌هایی از ساختار است که لازم است به‌سرعت و قبل از عمیق‌تر شدن فساد، اقدامات بازدارنده صورت پذیرد به عبارت دیگر زمانی که تراکنش‌ها یا دارایی‌های اشخاص، به‌صورتی غیرعادی افزایش یابد، دسته‌بندی اشخاص تغییر یافته و نشانه‌های آغاز شکل‌گیری فساد آشکار می‌گردد که این بهترین زمان برخورد با فساد است.

مجوز احداث یک خط تولید یکی از مهم‌ترین نقاط شکل‌گیری و گسترش فساد در کشور است که در این مقاله با ارائه‌ی یک مدل تلفیقی NLP-IF-SVM (شکل 1) به جزییات یک روش کاملاً عملیاتی مبتنی بر هوش مصنوعی جهت مقابله با تولید و گسترش فساد پرداخته شد.

استفاده از این مدل NLP-IF-SVM در نقاط دیگری از چرخه‌ی فساد خیز اقتصادی کشور نیز کاربرد دارد که تعدادی از آنها به شرح زیر می‌باشد:

ثبت سفارشات واهی و ورود محصولاتی بی ارزش به جای محصولات با ارزش ادعایی؛
کم اظهاری در صادرات و بیش اظهاری در واردات؛
فساد سیستماتیک در ارز چند نرخی؛
نظارت هوشمند بر بازار و جلوگیری از سوء استفاده ی عرضه کنندگان؛
پبش‌بینی هوشمندانه‌ی عرضه و تقاضا و جلوگیری از شوک‌های اقتصادی به جامعه؛
پایش عرضه و تقاضای انرژی و مبارزه با فساد گسترده در هدررفت بدون کنترل مواد و انرژی؛
بهره وری کارخانه‌ها؛
تراستی‌ها و بازگشت سریع ارز حاصل از صادرات؛
کنترل دقیق و مکانیزه‌ی اقلام ورودی به گمرک و جلوگیری از اظهار و واقعیت.

و در نهایت، بزرگ‌ترین مشکل اقتصاد کشور یعنی خصولتی‌ها یا شبه دولتی‌ها نیز با استفاده از ساختار NLP-IF-SVM در 3 گام:

راستی‌آزمایی اسناد و مدارک خصولتی‌ها؛
شناسایی پرونده‌های مشکوک خصولتی‌ها؛
شناسایی شبکه‌های فساد درگیر در پرونده‌های مشکوک خصولتی‌ها؛

قابل شناسایی و برخورد قاطع است.

گر نه موشی دزد در انبار ماست

گندم انبار چِل ساله کجاست

اول ای جان

دفع شر موش کن

وانگهان

در جمع گندم جوش کن

“مولانا – دفتر اول مثنوی”

مراجع:

غول پرسه زن بی بازده – قسمت اول : صنعت هوشمند شماره 234 شهریور 1404
غول پرسه زن بی بازده – قسمت دوم : صنعت هوشمند شماره 235 مهر 1404

[i] Natural Language Processing
[ii] Large Language Model
[iii] Support Vector Machine
[iv] Deep Learning
[v] Isolation Forest
[vi] Matlab
[vii] Graph Neural Network