نام پژوهشگر: مارسل میدر

مطالعه کمومتری بنیادین بر روی ابهام چرخشی برای سیستم های سه و چهار جزئی در داده های چند متغیره
پایان نامه وزارت علوم، تحقیقات و فناوری - دانشگاه تحصیلات تکمیلی علوم پایه زنجان - دانشکده شیمی 1390
  آزاده گلشن   مارسل میدر

چکیده آنالیز روش های نرم به عنوان یک ابزار مهم کمومتریکس در بررسی و تفکیک ماتریس داده به دو ماتریس غلظت و طیف خالص گونه های فعال در سیستم بکار برده می شوند. عدم نیاز به داشتن اطلاعات درباره مدل شیمیایی سیستم، کاربرد این روش ها را در حضور گونه های فعالی که در فرآیند مورد نظر شرکت ندارند، گسترده می سازد. اما تفکیک ریاضی یک ماتریس داده به روش های آنالیز نرم، به طور ذاتی با دو نوع منبع ابهام روبرو است که این ابهام ها باعث می شوند که تعداد زیادی جفت ماتریس غلظتی و طیفی از تفکیک ماتریس داده به-وجود آید که با غلظت و طیف واقعی تفاوت دارند که این تفاوت ممکن است شدتی یا چرخشی باشد. در نتیجه به جای جواب منحصر به فرد، دامنه ای از جواب به دست می آید. با اعمال محدودیت های مناسب از جمله غیر منفی بودن طیف خالص و غلظت گونه ها، بسته بودن، تک قله ای و یا سر هم زدن داده ها می توان دامنه جواب را در این روش ها محدودتر کرد. در سال ????، لاوتن و سیلوستر برای اولین بار روش آنالیز نرم (smcr) را معرفی کردند. همچنین با استفاده از این روش دامنه ی جواب های ممکن برای هر جز خالص محاسبه شد. جواب های مثبت حاصل روی یک خط قرار می گیرند و دامنه جواب برای هر جز توسط مرزهای پایین و بالا احاطه می شوند. در سال ????، برگن و همکارش روش لاوتن و سیلوستر را برای سیستم های سه جزئی بسط دادند. غیر منفی بودن پروفایل های حاصل تنها محدودیت مورد استفاده در این روش است و الگوریتم توصیف شده در تفسیر و فهم کمومتریکسدانان مشکل می-باشد. همه ی روش های مدلسازی نرم بسته به تخمین اولیه مورد نیاز به یک حل ویژه داخل ناحیه ابهام چرخشی همگرا می شوند. با توجه به موارد ذکر شده, روش تحلیل عامل تفکیکی (rfa) به عنوان یکی از روش های نرم از این قاعده مستثنی نیست. روش تحلیل عامل تفکیکی یکی از روش های مدلسازی نرم است که به جستجوی ماتریس بهینه ایt، می پردازد که توسط روابط زیر پروفایل های غلظتی و طیفی را ایجاد کنند. s=?t-1v c=ut (1) به طوری که این پروفایل ها در معادله زیر صدق کنند. x=cs (2) در روش rfa, بردارهای ویژه چرخیده شده به طور تکرار پذیر اصلاح می شوند تا از محدودیت ها تبعیت کنند و در نهایت تابع حداقل مربعات را در فرآیند بهینه سازی غیر خطی مینیمم کنند. روش rfa بدلیل بهینه کردن تعداد پارامترهای کم (عناصر ماتریسt ) نسبت به روش های دیگر از سرعت و دقت خوبی برخوردار است. در سال ????، وثوق و همکارانش روش جامع و سیستماتیکی(grid search) براساس تحلیل عامل تفکیکی برای تعیین محدوده های ابهام چرخشی ایجاد کردند. این روش می تواند محدوده ها را برای سیستم دو جزئی محاسبه کند. روش grid search ماتریس t را جستجو می کند که ماتریس پروفایل-های غلظتی و طیفی حاصل از آن اختلاف بین داده های واقعی و داده های ساخته شده را به مقدار حداقل برساند. بدین منظور تمامی ماتریس های t که بتوانند پروفایل های غلظتی و طیفی صحیح ایجاد کنند به عنوان جواب در نظر گرفته می شوند. این روش قابل کاربرد در مورد داده های بدون نویز و با نویز است و کاربر قادر به اعمال هر محدودیتی در این روش است. در طی این دوره مطالعه و توسعه روش های تعیین ابهام چرخشی و تأثیر محدودیت مدل سازی سخت علاوه بر اعمال محدودیت غیر منفی بودن، بر دامنه پاسخ های ممکن در نتایج روش های نرم در سیستم های سه و چهار جزءی انجام شد. بدین منظور برای بدست آوردن همه ی جوابهای ممکن در ناحیه جواب از روش تعمیم یافته یgrid search دو جزئی در سیستم سه جزئی استفاده شده است. روش گرافیکی تعیین محدوده های چرخشی با استفاده از rfa بر اساس روش rfa ماتریس انتقال t در یک سیستم سه جزئی به صورت زیر تعریف می شود: (3) در این سیستم ماتریس t دارای نه عضو است که به منظور کاهش پارامترهای ماتریس انتقال و کاهش ابعاد فضا به منظور قابل مشاهده شدن تغییرات، از نرمال ماتریس انتقال استفاده می شود. نرمال کردن ماتریس t با ضرب عناصر آن در یک اسکالر امکان-پذیر است. روش های متفاوتی برای نرمال کردن ماتریسt وجود دارد که در اینجا نرمال کردن به ردیف اول (تمام ردیف ماتریس t به عناصر ردیف اول آن تقسیم می شوند) انتخاب شده است. بدین معنا که ردیف اول ماتریس t در اثر نرمال کردن به 1 تبدیل می شوند. با استفاده از همین ویژگی می توان تنها عناصر باقیمانده را برای رسیدن به ماتریس بهینه جستجو کرد. نرمال کردن ماتریس t در این روش علاوه بر مزیت کاهش ابعاد و تعداد پارامتر ها، عاملی برای حذف ابهام شدتی در تحلیل داده ها خواهد بود. در نتیجه ابهام چرخشی به طور معمول عامل اصلی این ناحیه جواب است. حاصل نرمال کردن معادله (3) در معادله ی (4) آورده شده است: (4) در این روش که بر پایه الگوریتم rfa و به صورت grid searchانجام می شود تمام فضای داده برای یافتن ماتریس های t بهینه جستجو می شود. در این روش دو عضو از ماتریس t نرمال شده (مثلاً t31, t21) در تکرارهای grid search ثابت می ماند و چهار عنصر دیگر آن توسط الگوریتم های جستجو محاسبه می گردد. جوابهای ممکن با مینیمم شدن اختلاف بین داده های واقعی و ساخته شده به ازای یک دامنه از مقادیر t31, t21 به دست خواهند آمد. حال بر این اساس مجموع مربعات اختلاف می تواند به صورت گرافیکی بر حسب دو عنصر t31, t21 ماتریس t نمایش داده شود. حاصل یک سطح سه بعدی است. در هر نگاشت خطا برای سیستم-هایی که حل منحصر به فرد ندارند، یک سطح مینیمم وجود دارد که در سیستم های دارای حل منحصر به فرد تبدیل به یک مینیمم تیز می شود. هر نقطه داخل سطح مینیمم به عنوان یک جواب محسوب می شود و همه ی نقاط داخل این سطح به طور یکسان با داده ها برازش می شوند. جهت بررسی این موضوع داده های کروماتوگرافی با همپوشانی و سطح نویزهای متفاوت تولید و توسط روش موردنظر تحلیل شدند. کارآیی روش توسط تحلیل داده های سه جزءی شبیه سازی شده بررسی شد. نتایج، توانایی این روش را در تحلیل داده های مختلف نشان می دهد. سه ناحیه ای که به صورت سفید یکنواخت در این شکل 1 نشان داده شده است پاسخ های ممکن برای سه گونه فعال جذبی در سیستم در هر فضا می باشند. شکل 1: سطح، مربوط به داده ی فرضی کروماتوگرافی سه جزءی که برای آن حل منحصربه فرد وجود ندارد. این تحقیق یک روش عمومی برای محاسبه جوابهای ممکن پرفایل های طیفی و غلظتی برای سیستم های سه جزئی نشان داده شده است که برای هر گونه یک ناحیه بدست می آید که در این کار با عنوان سطح جوابهای ممکن afs معرفی گردید. به منظور محاسبات و زمان کمتر توسعه این الگوریتم بر اساس جستجوی مرزهای afsاز دیگر کارهای انجام شده در این تحقیق می باشد. در این روش بر اساس الگوریتم simplex تنها با سه نقطه با مختصات t31, t21 به جای جستجو در یک دامنه از t31, t21، مرزهای دامنه جواب بدست می آید. تخمین این سه نقطه میتواند بیرون، داخل و یا روی مرز باشد که با الگوریتم های توضیح داده شده در این پایان نامه این سه نقطه به مرز رسیده و در امتداد مرز حرکت کرده تا مرز کامل شود. روش جدید سریعتر از روش قبلی می باشد و به مراحل کمتری نیاز دارد. همچنین در طی این دوره مطالعه و توسعه روش های تعیین ابهام چرخشی و تأثیر محدودیت مدل سازی سخت علاوه بر اعمال محدودیت غیر منفی بودن، بر دامنه پاسخ های ممکن در نتایج روش های نرم در سیستم سینیتکی سه جزءی انجام شد. در یکی از حالات سیستم سینیتکی مورد بررسی به صورت دو واکنش مرتبه اول موازی با دو ثابت سرعت 05/0=k1 و 15/0=k2 در نظر گرفته شد. با فرض عدم جذب یکی از مواد اولیه در ناحیه طول موجی مورد بررسی، سیستم سه جزءی مورد نظر شبیه سازی شد. به منظور نزدیکی هر چه بیشتر مدل با سیستم واقعی، نویزی با انحراف استاندارد 003/0 و توزیع نرمال، به داده ها اضافه شد. برای تأثیر محدودیت مدل سازی سخت، در ابتدا توسط روش جستجوی شبکه grid search)) بر اساس تفکیک آنالیز فاکتوریrfa))، تمام پاسخ های ممکن برای داده شبیه سازی شده با اعمال محدودیت غیر منفی بودن در فضای u و v محاسبه گردید. همچنین با اعمال محدودیت مدل سازی سخت برای واکنش اول و محدودیت غیر منفی بودن در روش های نرم توسط روش جستجوی شبکه ای بر اساس تفکیک آنالیز فاکتوریrfa))، دامنه پاسخ های ممکن محاسبه گردید. با اعمال محدودیت مدل سازی سخت بر واکنش اول، پارامترهای t21,t31,t22,t32 در معادله 4 ثابت می ماند. در نتیجه دامنه جواب در حضور محدودیت مدل سازی سخت بسیار محدودتر می گردد به طوری که منجر به جوابهای منحصر به فرد برای غلظت گونه های شرکت کننده در واکنش اول می شود. به دلیل ثابت ماندن این چهار پارامتر، تعداد نقاط متناظر در این فضا که غلظت گونه ها را می سازند کاهش می یابد که در نتیجه آن به محدود شدن دامنه جواب برای غلظت گونه باقیمانده که در سیستم سینیتکی در مدل سازی سخت در نظر گرفته نشده است نیز می شود. با مقایسه دامنه جواب در غیاب و حضور محدودیت مدل سازی سخت در شکل 2 الف و ب این نتایج تأیید می شوند. شکل 2: الف) . پاسخ های ممکن در فضای u و با اعمال محدودیت غیر منفی بودن ب) پاسخ های ممکن در فضای u و با اعمال محدودیت غیر منفی بودن و مدل سازی سخت. پرفایل های غلظتی قبل و بعد از اعمال محدودیت مدل سازی سخت در سمت راست نشان داده شده است. همچنین نتایج قابل مشابهی از بررسی های تئوری و شکل های نشان داده شده در فضای v حاصل گردید که در این بررسی دستیابی به جواب منحصر به فرد طیفی برای گونه باقیمانده که در سیستم سینیتکی در مدل سازی سخت در نظر گرفته نشده است از نتایج قابل توجه با اعمال این محدودیت می باشد. نتیجه ی محدود شدن دامنه جواب در این فضا که طیف گونه ها را می سازند، محدود شدن تعداد نقاط متناظر با اعمال محدودیت مدل سازی سخت می باشد. می توان با تبدیل هر سه نقطه متناظری که از روش rfa در هر یک از فضاهای u و v محاسبه شده است، بر اساس معادله (1) غلظت و طیف گونه ها را به دست آورد که در شکل 2 الف و ب نشان داده شده است.. از دیگر مزایای اعمال این محدودیت در روش های نرم محاسبه ثابت سرعت k1 که از جمله پارامترهای مدل میباشد علاوه بر محدود شدن دامنه جواب قابل ذکر می باشد. در بخش سوم کار به بسط الگوریتم پیشنهادی سه جزءی در یک سیستم چهار جزءی پرداخته شده است. در سیستم های چهار جزئی طبق معادله (3) هر ماتریس مربع و غیر منفرد t شانزده عنصر دارد. (5) محاسبه جوابهای ممکن برای هر گونه در یک سیستم چهار جزءی بصورت یک حجم در فضا می باشند که نیاز به فضای چهار بعدی برای نمایش گرافیکی می باشد. بدلیل محدودیت های نمایش گرافیکی در بیشتر از سه بعد، در این تحقیق تلاش شده تا موقعیت دامنه جوابها در فضای سه بعدی نشان داده شود. این تحقیق یک روش عمومی برای محاسبه جوابهای ممکن پرفایل های طیفی و غلظتی برای سیستم های چهار جزئی نشان داده شده است که برای هر گونه یک حجم بدست می آید. در این روش سه عضو از ماتریس t نرمال شده (مثلاً t41, t31, t21) در تکرارهای grid search ثابت می ماند و نه عنصر دیگر آن توسط الگوریتم های جستجو محاسبه می گردد. بعد از جستجوی (grid search) به ازای یک دامنه از مقادیر t41, t31, t21 تمام حالت های ممکن برای ماتریسt در فضای داده و انجام مراحل بالا برای هر یک از آنها، مجموع مربعات اختلافات تمام حالت های ممکن محاسبه می شود. برای نشان دادن موقعیت دامنه جوابها در فضای سه بعدی نیاز به انتخاب یک حد آستانه می باشد که در این روش از اختلاف داده های واقعی و بازسازی شده با چهار جزء توسط تجزیه مقادیر منفرد (svd) محاسبه میشود. در نتیجه تمام حالت های ممکن از ماتریس t که مجموع مربعات اختلاف داده های واقعی و بازسازی شده کمتر از این حد آستانه می باشند تشکیل یک حجم در فضای سه بعدی می دهند. همچنین الگوریتم simplex قابل بسط در سیستم های چهار جزئی می-باشد. در این کار با پیمایش یکی از ابعاد میتوان مرزهای حجم دامنه جواب را بدست آورد. همانند الگوریتم سه جزءی در این تحقیق نیز تنها با سه نقطه با مختصات t21, t31 حجم دامنه جواب بدست آورد. به ازای هر نقطه روی یکی از ابعاد، الگوریتم بکار برده شده در سیستم سه جزءی بکار برده می-شود. در نتیجه به ازای هر نقطه (t41) روی این محور یک سطح مقطع از حجم حاصل می شود که برای کامل شدن حجم باید در امتداد این محور پیمایش شود. همانند روش سه جزءی، تخمین این سه نقطه میتواند بیرون، داخل و یا روی مرز باشد. جهت بررسی این موضوع داده های کروماتوگرافی با همپوشانی تولید و توسط روش موردنظر تحلیل شدند. نتایج در شکل 3، توانایی این روش را در تحلیل داده-های مختلف نشان می دهد. شکل 3: الف) . پاسخ های ممکن در فضایv و با اعمال محدودیت غیر منفی در سیستم چهار جزئی کروماتوگرافی. حجمهای بدست آمده از الگوریتم simplex و روش عمومی در سمت راست نشان داده شده است.