در کشورهای مختلف جهان در سالهای اخیر، مطالعاتی انجام شده و روشهای کشف فساد مبتنی بر هوش مصنوعی توسعه داده شده است که در یک بررسی اجمالی در بسیاری از این کشورها، از فرار مالیاتی به عنوان یکی از بزرگترین تخلفها نام برده شده
اما شرایط کشورهای مختلف با شرایط ایران متفاوت است.
درست است که فرار مالیاتی در ایران نیز به عنوان یکی از مصادیق فساد قابل طرح و بررسیست اما اَشکال مختلف فساد در کشورمان، آنچنان متنوع و پیچیدهاند که در کمتر کشوری میتوان این سطح از گستردگی را مشاهده کرد و همین شرایط ویژه و منحصر به فردِ ایران، راه حلهای مبارزه با فساد را نیز منحصر به فرد میکند.
در موضوع مشخص فرار مالیاتی، ساختار اقتصادی کشور به گونهای ست که ۲۰ درصد اقتصاد در اختیار دولت، ۶۰ درصد در اختیار خصولتیها و تنها ۲۰ درصد آن در دست بخش خصوصی واقعیست و یکی از بزرگ ترین مشکلات اقتصاد کشور، در فرار مالیاتی این خصولتی ها ست. [1و2] غول پرسهزن بیبازده – قسمت اول و غول پرسهزن بیبازده – قسمت دوم
در ماده ۴۴ قانون اساسی در رابطه با خصوصیسازی و اصلاحیهی آن در سال ۱۳۹۹ ضوابطی در خصوص اعلام صورتهای مالی در کُدال و در دسترس قرار گرفتن آن برای عموم مردم آمده است؛ ولی چنانکه بهروشنی در مقالهی غول پرسهزن بیبازده [۱ و ۲] آمده است تنها بخش بسیار کوچکی از این خصولتیها یا حکومتیها، آن هم در بازهی زمانی کوتاهی، این اطلاعات را منتشر کردهاند و البته از همان مختصر اطلاعات فاش شده به روشنی میتوان چهرهی واقعی خصولتیها و علت عدم انتشار بیشترِ اطلاعات را حدس زد.
بهرهوری و ساختار درآمد و هزینه و بسیاری دیگر از اطلاعات موجود در این صورتهای مالی، از ناکارایی بسیار بالای این بخش عمدهی اقتصاد کشور حکایت میکند و در این میان، فرارهای مالیاتی نیز به وضوح به چشم میخورد. بنابراین تا ارادهای در حاکمیت مبنی بر پاسخگو کردن این خصولتیها یا واگذاری کامل آنها به بخش خصوصی واقعی مشاهده نگردد، ورود به مسئلهی فرار مالیاتیِ ۲۰ درصد اقتصاد خصوصی واقعی در این مقاله، ظلمیست مضاعف بر این بخش ستمدیدهی اقتصاد، از طرفی حاکمیت با توجه به تحریمهای بینالمللی و مشکل بزرگ کاهش منابع، آنچنان با استفاده از ابزارهای مختلف، اخذ مالیات بخش خصوصی را در سالهای اخیر گسترش داده است که استفاده از روشهای مبتنی بر هوش مصنوعی در پرداخت مالیات، ظلمیست بزرگ بر این بخش و بنابراین از مصادیق طرح شده در این مقاله خارج میگردد و به دیگر سناریوهای فساد منحصربهفرد ایران که کمتر به آنها توجه شده، پرداخته خواهد شد.
در تاریخ 7 اسفند 1403، معاون هماهنگی و پیگیری نهاد ریاست جمهوری با اشاره به وجود ۷۴ هزار پروژهی ناتمام در کشور اظهار کرد: «برای تکمیل این پروژهها به ۴۸۰۰ همت اعتبار و ۴۴ سال زمان نیاز است که این عدد با توجه به نرخ دلار در اسفند ۱۴۰۳، معادل 60 میلیارد دلار است».
یکی از بزرگترین مسیرهای شکلگیری فساد در کشور، از دریافت مجوز احداث واحدهای صنعتی شروع میشود و احداث یک واحد صنعتی در نتیجهی انجام مطالعات فنی-اقتصادی و پس از توجیهپذیری احداث آن واحد، آغاز میگردد و در این راستا، نقشهی راه توسعهی اقتصادی هر کشوری به عنوان چراغِ راهِ آغازِ این سرمایهگذاری، مورد استفاده قرار میگیرد که در این نقشهی راه، شاخصهای مختلفی مانند مزیتهای رقابتی سرزمین، میزان نیاز به محصولات مختلف در داخل کشور، توجیهپذیری صادرات، محصولات استراتژیک مورد نیاز و … مورد تحلیل قرار میگیرد.
اکنون سالهاست که در برنامههای توسعهی 5 سالهی کشور، تدوین نقشهی راه توسعهی صنعتی به عنوان یک اولویت در دستور کار قرار گرفته است. اما متأسفانه، مشابه بسیاری دیگر از بندهای برنامههای توسعه، که نوشته شده است تا انجام نشود، تدوین مسیر توسعهی صنعتی کشور نیز هنوز به شکلی جدی آغاز نشده است. در چنین شرایطی، سرمایهگذاریهای صنعتی در کشور عمدتاً نه بر مبنای شاخصهای واقعی توسعه، بلکه براساس استفاده از منابع ملی سرزمین، یارانههایی که متعلق به عموم مردم است، در مسیر تخریب محیط زیست و در جهت سودجویی بخشی، انجام شده است.
در این نقطه است که هوش مصنوعی، در کنترل مجوزهای احداث واحدهای صنعتی به عنوان یکی از نقاط اصلی آغاز فساد در کشور، به کار گرفته میشود:
- جهت احداث یک خط تولید، دریافت مجوزهای متعددی پیشبینی شده است که از ثبت نام و مجوزهای اولیه آغاز، و به دریافت پروانهی بهرهبرداری و شروع تولید ختم میشود و برای اخذ هر مجوز، در حالت طبیعی مدت زمانی لازم است. پس مدت زمان دریافت هر مجوز، بهعنوان اولین پارامترهای ورودی به الگوریتم هوش مصنوعیِ تشخیصدهندهی فساد مورد نظر قرار میگیرد، چرا که اولین ریشههای فساد از همین مدت زمانهای دریافت مجوز قابل شناساییست. طرحهای عادی در زمانی نرمال و در بسیاری موارد، بیش از نرمال مورد بررسی قرار میگیرد و طرحهای مسئلهدار، با پرداخت رشوه به شیوههای گوناگون و یا از طریق ارتباطات پنهان، بهسرعت بررسی و مجوز مربوطه بدون ضوابط قانونی، صادر میگردد.
- در کنار مدت زمان اخذ مجوز، کارشناس بررسیکنندهی طرح نیز نقش تعیین کنندهای بازی میکند و مجموعهی اطلاعات کارشناسان ادارات مرتبط که به گونهای در فرآیند دریافت مجوزها نقش دارند، به عنوان ورودی های الگوریتم مورد توجه قرار میگیرند.
- اما همهی مجوزها، نقش بالایی در احداث یک خط تولید و در نهایت شکست یا موفقیت آن بازی نمیکنند و از بین آنها تعدادی نقش حیاتی دارند که در الگوریتم، باید به آنها توجه ویژه شود.
- یکی از مهمترین مجوزها، طرح توجیه فنی-اقتصادی پروژه و بررسی مطالعات بازار طرح مورد نظر است. این طرحها از طریق مشاوران مورد تأیید نهادهای دولتی انجام میشود اما سهواً و یا عمداً اشتباهاتی در این مطالعات اتفاق میافتد که در میانهی راه، طرح توجیه شده، به سرنوشت 60 میلیارد دلار پروژههای نیمه تمام دچار میشود. بنابراین به روشهای مختلف، موارد زیر باید بررسی شود:
- به روز بودن تکنولوژی خط تولید؛
- قیمت درست خط تولید: در بسیاری موارد قیمت خط تولید، بالاتر اعلام میگردد تا بر اساس آن بتوان تسهیلات ویژه دریافت کرد و در برخی موارد، این قیمت به عمد پایین در نظر گرفته میشود تا توجیهپذیری کاذب ایجاد کند؛
- قیمت مواد اولیه و سرمایه در گردش؛
- قیمت انرژی؛
- قیمت فروش محصول؛
- بازار واقعی داخلی؛
- بازار واقعی خارجی؛
- فضای صادرات؛
- تعداد کارکنان مورد نیاز واقعی در خط تولید؛
…
حل مسئلهی کشف فساد در مجوزها به سه بخش زیر تقسیم میگردد:
- راستیآزمایی مدارک درخواست مجوز؛
- کشف مجوزهای صادر شدهی مشکوک به فساد؛
- کشف شبکهی فساد درگیر در صدور مجوزهای مشکوک؛
بخش اول: راستیآزمایی مدارک درخواست مجوز
بهترین روش اعتبارسنجی موارد فوقالذکر براساس یکی از روشهای مبتنی بر هوش مصنوعی یعنیNLP [i]یا پردازش زبان طبیعی ست که لازم است تا بر مبنای مدلهای زبانی بزرگ یا LLM [ii]های داخلی مبتنی بر سامانهی دولت الکترونیک که اطلاعات پروژههای قبلی در آنهاست و نیز بر مبنای LLMهای بینالمللی و قبل از شروع مراحل بعد، اعتبار اطلاعات طرحهای توجیه فنی اقتصادی راستیآزمایی شود.
لازم به ذکر است که این مرحله نیز به صورت کاملاً مکانیزه انجام شده و تمام مدارک مورد نیاز دریافت مجوز که تا کنون بدان اشاره شد از جمله طرح توجیهی و مطالعات بازار و بررسیهای محیط زیستی و … به عنوان ورودی یک سامانهی مبتنی بر NLP در نظر گرفته شده و خروجی سامانه، نتیجهی اعتبارسنجی مدارک طرح خواهد بود.
یکی از مزایای روش مبتنی بر NLP نسبت به روشهای سنتی، کشف گزارشهای غلط از گزارشهای واقعیست. متأسفانه بسیار دیده شده است که انواع گزارشهای نادرستِ تهیه شده توسط مشاوران مختلف، به دلایل فراوان از جمله اصرار و فشار نمایندگان مجلس بر مشاور و بر نهادهای دولتی بر احداث کارخانهای در نقطهای از کشور که هیچ توجیهی ندارد، خسارتهای جبرانناپذیری را بر پیکر اقتصاد کشور وارد کرده و ریشهی اصلی 60 میلیارد دلار طرح نیمه تمام کنونی کشور شده است.
با استفاده از سامانهی ماشینی مبتنی بر NLP جلوی این دسته از فساد های بزرگ گرفته میشود.
خروجی NLP پروندههای درخواست مجوز، به همراه پارامترهای زیر بهعنوان ورودیهای یک شبکهی عصبی جدید در مرحلهی بعد در نظر گرفته میشود:
- مدت زمان دریافت هر یک از مجوزها؛
- میزان IRR طرح؛
- امتیاز زیستمحیطی؛
- فاصلهی زمین تا شهر؛
بخش دوم: کشف مجوزهای صادر شدهی مشکوک به فساد
شبکههای عصبی از لحاظ روش یادگیری به 3 دستهی تحت نظارت، بدون ناظر و تقویتشده تقسیم میشوند که در مواردی که اطلاعات آموزشی به معنای ورودی و خروجی مورد نظر در دست نیست، بهتر است از شبکههای با یادگیری بدون ناظر استفاده کنیم.
مسئلهی مورد نظر ما در بخش کشف فساد، از همین جنس است یعنی معمولاً مجموعهی مناسبی (از نظر تعداد و کیفیت نمونهها) از نمونههای کشف شدهی قبلیِ فساد در مجوزهای قبلیِ دریافت شده وجود ندارد، بنابراین لازم است که بهتدریج پروندههای اخذ مجوز به سامانه وارد شده و بهصورت بدون ناظر جداسازی لازم صورت پذیرد. بدین ترتیب با ورود هر پرونده، عملیات طبقهبندی به تدریج شکل گرفته و پروندههای درگیر فساد از پروندههای سالم جدا میگردد.
بدین منظور انواع مختلفی از شبکههای عصبی را میتوان به کار گرفت که از مهمترین و قدیمیترین آنها، میتوان به SVM [iii] اشاره کرد که بهمنظور دستهبندی نمونههای ورودی بدون نظارت استفاده میگردد. نمونههای عملی این شبکهی عصبی در سال 1995 ارائه و در طول سالهای گذشته توسعه یافته است. اما در جایی که الگوهای ورودی که در مثال مورد نظر ما، تعداد مجوزهای احداث کارخانه است، زیاد شود و با فرض اینکه نمونههای آلوده به فساد نسبت به نمونههای سالم، بسیار کمتر باشد (که امیدواریم اینگونه باشد) حجم محاسبات در SVM سنگین میشود و لازم است تا از روشهای دیگر با سرعت بالاتر استفاده شود که یکی از این روشها که اولین نسخهی آن در سال 2008 ارائه شد و تا کنون بهروزرسانیهای فراوانی بر روی آن انجام شده و در یکی از نسخههای جدید آن، با الگوریتم یادگیری عمیق[iv] نیز ترکیب شده است، روش IF [v]است که امروزه بهعنوان یک روش هوشمند استاندارد به منظور کشف فساد و کشف تقلب به کار گرفته می شود.
روش IF از لحاظ نوع الگوریتم آموزشی، بدون ناظر است ولی سرعت جداسازی الگوهایی که با بقیه متفاوتند، در آن بسیار بالاست. در مثال مورد نظر ما یعنی مجوزهای احداث خط تولید، هر سطر ماتریس ورودی به IF شامل یک مجوز خط تولید و هر ستون، یکی از ویژگیهای مجوز است. بهعنوان مثال سرعت اخذ هر مجوز به عنوان یک ویژگی در نظر گرفته میشود. سایر پارامترها شامل IRR، امتیاز محیط زیست، انرژی، آوردهی سرمایهگذار و … از دیگر ویژگیهای هر مجوز است که برای هر مجوز در ستونهای ماتریس قرار میگیرد.
جهت استفاده از کدهای آماده، از روشهای مختلف میتوان استفاده کرد که یکی از آنها توابع Python آماده است. نرمافزار محبوب دیگری که در اینگونه موارد استفاده میگردد، نرمافزار متلب[vi] است که در آن از تابع iforest میتوان بهسادگی با ورود ماتریس مجوزها و ویژگیهای فوقالذکر به آن، مجوزهای مشکوک به فساد را جدا نمود و آن مجوزهای مشکوک را به منظور بررسی بیشتر و یافتن شبکهی افراد فاسد به کار برد.
این مجوزهای مشکوکِ جدا شده، به عنوان ورودی شبکهی عصبی دیگری مورد استفاده قرار میگیرد که در صورتی که ارتباطات افراد و شرکتها مشخص باشند، بهترین کاندید، شبکهی GNN [vii] است ولی با توجه به آنکه شبکهی فساد به روشهای گوناگون به مخفی کردن ارتباطات میپردازد، استفاده از GNN در این مرحله منتفی ست و با توجه به آنکه در بخش اول با استفاده از IF ، کل مجوزهای احداث کارخانه به مجوزهای مشکوک تبدیل شد، حجم اطلاعات ورودی به بخش سوم کاهش یافته و بهگونهای ست که ساختارهای مبتنی بر SVM برای تحلیل بخش سوم کافی و پر سرعت است.
بخش سوم: کشف شبکهی فساد درگیر در صدور مجوزهای مشکوک
بدون ورود به جزییات، ساختارهای هوشمند مبتنی بر SVM جهت طبقهبندی اطلاعات استفاده میشود و در این بخش پایانیِ الگوریتم هوشمند، در پی آنیم که در مجوزهای مشکوکی که در خروجی IF شناسایی شده است، تمام عوامل دخیل در اخذ مجوز و ادامهی فعالیت آن را در طول زمان بهوسیلهی ماشین، بررسی و عوامل مرتبط با فساد، شناسایی و اعلام گردد: این عوامل که ورودیهای SVM هستند، عبارتند از:
- مجموع گردش حساب صادرکنندگان (و وابستگان آنها) مجوز احداث در بخشهای مختلف نهادهای دولتی– به ازای هر شخص صادرکننده ی مجوز، یک ورودی SVM؛
- مجموع دارایی صادرکنندگان (و وابستگان آنها) مجوز احداث در بخشهای مختلف نهادهای دولتی– به ازای هر شخص صادرکنندهی مجوز، یک ورودی SVM؛
- مجموع گردش حساب مالکان (و وابستگان آنها) مجوز احداث – به ازای هر مالک، یک ورودی SVM؛
- مجموع دارایی مالکان (و وابستگان آنها) مجوز احداث – به ازای هر مالک، یک ورودی SVM؛
- نسبت وام دریافتی بر روی مجوز احداث کارخانه به هزینهی انجام شده در ساخت کارخانه؛
- نسبت پیشرفت واقعی احداث خط تولید به پیشرفت برنامهای آن؛
- رتبهی اعتباری واسطهها یا تراستیها در تراکنشهای مربوط به پروژه؛
- …
با تنظیم پارامترهای یادگیری SVM ، اطلاعات ورودی فوق در خروجی شبکه دستهبندی شده و با ورود دائمی اطلاعات ورودی و به روز شده در فواصل زمانی مشخص، میتوان حرکت ورودیها از دستهای به دستهی دیگر را مشاهده کرد. این تغییر دستهها به معنای سیگنالهای هشدار آغاز فساد در بخش یا بخشهایی از ساختار است که لازم است بهسرعت و قبل از عمیقتر شدن فساد، اقدامات بازدارنده صورت پذیرد به عبارت دیگر زمانی که تراکنشها یا داراییهای اشخاص، بهصورتی غیرعادی افزایش یابد، دستهبندی اشخاص تغییر یافته و نشانههای آغاز شکلگیری فساد آشکار میگردد که این بهترین زمان برخورد با فساد است.
مجوز احداث یک خط تولید یکی از مهمترین نقاط شکلگیری و گسترش فساد در کشور است که در این مقاله با ارائهی یک مدل تلفیقی NLP-IF-SVM (شکل 1) به جزییات یک روش کاملاً عملیاتی مبتنی بر هوش مصنوعی جهت مقابله با تولید و گسترش فساد پرداخته شد.
استفاده از این مدل NLP-IF-SVM در نقاط دیگری از چرخهی فساد خیز اقتصادی کشور نیز کاربرد دارد که تعدادی از آنها به شرح زیر میباشد:
- ثبت سفارشات واهی و ورود محصولاتی بی ارزش به جای محصولات با ارزش ادعایی؛
- کم اظهاری در صادرات و بیش اظهاری در واردات؛
- فساد سیستماتیک در ارز چند نرخی؛
- نظارت هوشمند بر بازار و جلوگیری از سوء استفاده ی عرضه کنندگان؛
- پبشبینی هوشمندانهی عرضه و تقاضا و جلوگیری از شوکهای اقتصادی به جامعه؛
- پایش عرضه و تقاضای انرژی و مبارزه با فساد گسترده در هدررفت بدون کنترل مواد و انرژی؛
- بهره وری کارخانهها؛
- تراستیها و بازگشت سریع ارز حاصل از صادرات؛
- کنترل دقیق و مکانیزهی اقلام ورودی به گمرک و جلوگیری از اظهار و واقعیت.
و در نهایت، بزرگترین مشکل اقتصاد کشور یعنی خصولتیها یا شبه دولتیها نیز با استفاده از ساختار NLP-IF-SVM در 3 گام:
- راستیآزمایی اسناد و مدارک خصولتیها؛
- شناسایی پروندههای مشکوک خصولتیها؛
- شناسایی شبکههای فساد درگیر در پروندههای مشکوک خصولتیها؛
قابل شناسایی و برخورد قاطع است.
گر نه موشی دزد در انبار ماست
گندم انبار چِل ساله کجاست
اول ای جان
دفع شر موش کن
وانگهان
در جمع گندم جوش کن
“مولانا – دفتر اول مثنوی”
مراجع:
- غول پرسه زن بی بازده – قسمت اول : صنعت هوشمند شماره 234 شهریور 1404
- غول پرسه زن بی بازده – قسمت دوم : صنعت هوشمند شماره 235 مهر 1404
[i] Natural Language Processing
[ii] Large Language Model
[iii] Support Vector Machine
[iv] Deep Learning
[v] Isolation Forest
[vi] Matlab
[vii] Graph Neural Network
