کاربرد الگوریتم‌های داده‌کاوی در تفکیک منابع رسوبی حوزۀ آبخیز نوده گناباد

نویسندگان

چکیده

Introduction: Reduction of sediment supply requires the implementation of soil conservation and sediment control programs in the form of watershed management plans. Sediment control programs require identifying the relative importance of sediment sources, their quantitative ascription and identification of critical areas within the watersheds. The sediment source ascription is involves two main steps so that in the first, several diagnostic tracers are selected for obvious and significant separation of potential sources of sediment and in the second step selected tracers for potential sources of sediment are compared, with corresponding values extracted from the sediment samples taken in the watershed outlet. Also, due to the large amount and complexity of data available, nowadays in geo- and environmental sciences, we face the need to develop and incorporate more robust and efficient methods for their analysis and modelling. Therefore recent fundamental progress in data mining algorithms can considerably contribute to the development of the emerging field - environmental data science.  Methodology: According to what was said, in this research, the data mining algorithms used to separate sediment sources in the Nodeh watershed of Gonabad located in Razavi-Khorasan province by using the geochemical (includes the 21 elements of Mg, Sr, Mn, Ba, Zn, Y, V, Ti, Pb, P, Na, Li, K, Cu, Cr, Co, Ce, B, Ca, Al and Fe), granulometric (includes the D90, D50, D10, percent of sand, percent of silt, percent of clay, skewness and kurtosis and the diameters less than 1, 2 and 4 millimeters and less than 500, 250, 125 and 63 microns) and lithological variables (includes the quartz, tuff, laterite, dacite, andesite, dolomite, calcite, andesitic tuff, lithic andesite and salt). A set of 11 classification algorithms includes the decision tree, random forest, regression methods, discriminant analysis, local linear model tree, nearest neighbor analysis, support vector machine, logistic regression, artificial neural network, pattern recognition and group method of data handling programmed in the MATLAB software and the results compared based on the coefficient of determination and mean squared error.  Results and Discussion: Study of geochemical element concentrations in 7 geological units showed that the Ca, Fe, Mg and Al elements have the highest and B and Co have the lowest concentrations within the soil samples. Overall evaluation of classification algorithms in training stage showed that the discriminant analysis, random forest, k nearest neighbor and support vector machines with linear, polynomial, multiple and RBF kernels with maximum values of the coefficient of determination (R2=1) and minimum values of the mean squared error (RMSE=0) are the most accurate algorithms in sediment source separation but the regression trees method has the worst performance.  Also, at testing stage, the support vector machines with RBF kernel was the most accurate and the classification trees with maximum error rate was the most inaccurate algorithm. Also, entrance of geochemical and granulometric variables lead to the highest and lowest accuracy in the sediment source separation, respectively. Using the geochemical variables for the separation of sediment sources, types of support vector machines, nearest neighbor analysis, discriminant analysis and the random forest algorithm had the highest coefficients of determination and lowest error values in the training and testing stages. By entering the lithological variables, the random forest algorithm had the highest accuracy for the sediment sources classification in the training and testing stages and the discriminant analysis and support vector machines were located thereafter. Finally, fitting the classification algorithms using granulometric variables showed that the support vector machines had highest accuracy in the training and testing stages of models and the random forest and nearest neighbor analysis were ranked thereafter.  Conclusion:Totally, due to the proper accuracy and performance of data mining classifier algorithms, application of these methods in the natural sciences is suggested especially in the large amounts of data. These algorithms are used to find patterns in large sets of data and help classify new information. Especially, the support vector machines that are supervised classifier algorithms and besides that, in the natural sciences have successful results. In the watershed management considering the time and cost, sediment source ascriptions are difficult to obtain using monitoring techniques, but data mining procedures, have emerged as a potentially valuable alternative. Therefore, application and evaluation of these methods are suggested for further studies and natural sciences data.

برای دانلود باید عضویت طلایی داشته باشید

برای دسترسی به متن کامل این مقاله و 10 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

تعیین آستانۀ مؤثرترین عوامل بر افزایش طول خندق‌ها با استفاده از الگوریتم‌های داده‌کاوی و درخت تصمیم CART (بررسی موردی: حوزۀ آبخیز قاضیان، استان فارس)

یکی از روابط مهم در فرسایش خندقی، بررسی آستانه­های ایجاد و گسترش این فرسایش است. این روابط کمک می­کند تا بتوان با شناخت دقیق، راهکار مناسبی را پیش­بینی نمود و از تخریب اراضی به نحو مطلوب جلوگیری به عمل آورد. طی دهۀ اخیر، ظهور دانش­های نوین در تعیین رابطۀ بین متغیرها موجب توسعۀ روش­های پیش­بینی در علوم مختلف شده است و در نتیجه، بررسی قابلیت استفاده از آن­ها در مباحث فرسایش و حفاظت خاک، ضروری است...

متن کامل

تجارت آب مجازی و کاربرد آن در حوزۀ آبخیز (مطالعۀ موردی: حوزۀ آبخیز برآفتاب حاجی‌آباد و پایاب رودان، استان هرمزگان)

مشکل افت آب‌های زیرزمینی و کمبود آب در اغلب دشت‌های استان هرمزگان امری اجتناب‌ناپذیر است که در اثر استفادۀ بی‌رویه و عدم مدیریت مناسب در جهت عرضه و تقاضای آب در بخش کشاورزی رخ داده است. در تحقیق حاضر به محاسبۀ بیلان آب مجازی در بخش کشاورزی (صادرات و واردات آب مجازی) و ارزش آن در دو حوزۀ آبخیز با دو اقلیم متفاوت در شمال (حوزۀ آبخیز برآفتاب حاجی‌آباد) و شرق (حوزۀ آبخیز پایاب رودان) استان هرمزگان ...

متن کامل

طبقه‌بندی مشتریان اینترنت‌بانک با کمک الگوریتم‌های داده‌کاوی

طبقه‌بندی مشتریان با استفاده از الگوریتم‌های داده‌کاوی، بانک‌ها را قادر به حفظ و وفاداری مشتریان قدیم و جذب مشتریان جدید خواهد کرد. یکی از روش‌های داده‌کاوی، درخت تصمیم‌گیری است و چنانچه درخت تصمیم مناسبی ساخته شود، می‌توان مشتریان را به‎طور بهینه طبقه‌بندی کرد. در این نوشتار، یک مدل مناسب برای طبقه‌بندی مشتریان بر مبنای بهره‌گیری از خدمات اینترنت‌بانک ارائه شده است. این مدل بر اساس استاندارد C...

متن کامل

مقایسه عملکرد الگوریتم‌های داده‌کاوی در پیش‌بینی بیماری عروق کرونر

مقدمه: بیماری‌های قلبی- عروقی نخستین علت مرگ در جهان هستند و براساس برآورد سازمان بهداشت جهانی، مرگ ناشی از بیماری‌های قلبی تا سال۲۰3۰ به 23 میلیون مورد افزایش خواهد یافت. از این رو، به نظر می‌رسد استفاده از الگوریتم‌های داده‌کاوی برای پیش‌بینی بیماری عروق کرونر قلب بسیار کاربردی باشد. هدف از پژوهش حاضر مقایسه عملکرد الگوریتم‌های شبکه عصبی مصنوعی (ANN) و ماشین بردار پشتیبان (SVM) در پیش‌بینی بی...

متن کامل

مقایسه عملکرد الگوریتم‌های داده‌کاوی در پیش‌بینی بیماری عروق کرونر

مقدمه: بیماری‌های قلبی- عروقی نخستین علت مرگ در جهان هستند و براساس برآورد سازمان بهداشت جهانی، مرگ ناشی از بیماری‌های قلبی تا سال۲۰3۰ به 23 میلیون مورد افزایش خواهد یافت. از این رو، به نظر می‌رسد استفاده از الگوریتم‌های داده‌کاوی برای پیش‌بینی بیماری عروق کرونر قلب بسیار کاربردی باشد. هدف از پژوهش حاضر مقایسه عملکرد الگوریتم‌های شبکه عصبی مصنوعی (ANN) و ماشین بردار پشتیبان (SVM) در پیش‌بینی بی...

متن کامل

تحلیل تراکنش‌های امانت و گردش منابع کتابخانه‌های دانشگاه علوم پزشکی بیرجند با الگوریتم‌های داده‌کاوی

Introduction: Data mining is a process for discovering meaningful relationships and patterns from data. Identify behavior patterns of libraries users can helps improve decision-making in libraries. This study aimed to analyze the interlibrary loan transactions in Birjand University of Medical Sciences using data mining algorithms. Methods: In this descriptive study, knowledge discovery and d...

متن کامل

ذخیره در منابع من

ذخیره در منابع من ذخیره شده در منابع من

{@ msg_add @}

  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی راحت تر خواهید کرد

دانلود متن کامل

برای دسترسی به متن کامل این مقاله و 10 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید


عنوان ژورنال:

دوره 7  شماره 19

صفحات  81- 94

تاریخ انتشار 2018-08

با دنبال کردن یک ژورنال هنگامی که شماره جدید این ژورنال منتشر می شود به شما از طریق ایمیل اطلاع داده می شود.

کلمات کلیدی

copyright © 2015-2021