Modeling Sparse Data Using MLE with Applications to Microbiome Data

نویسندگان

چکیده

Modeling sparse data such as microbiome and transcriptomics (RNA-seq) is very challenging due to the exceeded number of zeros skewness distribution. Many probabilistic models have been used for modeling data, including Poisson, negative binomial, zero-inflated binomial models. One way identify most appropriate or hurdle based on p-value Kolmogorov-Smirnov (KS) test. The main challenge identifying model that parameters are typically unknown in practice. This paper derives maximum likelihood estimator (MLE) a general class We also derive corresponding Fisher information matrices exploring estimator's asymptotic properties. include new beta Our application shows our more than commonly literature.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

modeling loss data by phase-type distribution

بیمه گران همیشه بابت خسارات بیمه نامه های تحت پوشش خود نگران بوده و روش هایی را جستجو می کنند که بتوانند داده های خسارات گذشته را با هدف اتخاذ یک تصمیم بهینه مدل بندی نمایند. در این پژوهش توزیع های فیزتایپ در مدل بندی داده های خسارات معرفی شده که شامل استنباط آماری مربوطه و استفاده از الگوریتم em در برآورد پارامترهای توزیع است. در پایان امکان استفاده از این توزیع در مدل بندی داده های گروه بندی ...

pattern recognition in maintenance data using methodologies data minitng (cade study isfahan regional power electric company)

فعالیت های نگهداری و تعمیرات اطلاعاتی را تولید می کند که می تواند در تعیین زمان های بیکاری و ارایه یک برنامه زمان بندی شده یا تعیین هشدارهای خرابی به پرسنل نگهداری و تعمیرات کمک کند. وقتی که مقدار داده های تولید شده زیاد باشند، فهم بین متغیرها بسیار مشکل می شوند. این پایان نامه به کاربردی از داده کاوی برای کاوش پایگاه های داده چندبعدی در حوزه نگهداری و تعمیرات، برای پیدا کردن خرابی هایی که موجب...

15 صفحه اول

Variance Component Selection With Applications to Microbiome Taxonomic Data

1 Department of Epidemiology and Biostatistics, University of Arizona, Tucson, AZ, United States, 2 Department of Biostatistics, University of California, Los Angeles, Los Angeles, CA, United States, 3 Division of Pulmonary, Allergy, Critical Care, and Sleep Medicine, Department of Medicine, University of Arizona, Tucson, AZ, United States, 4 Division of Pulmonary, Critical Care, Sleep, and Occ...

متن کامل

Analysis of High Dimensional Compositional Data Containing Structural Zeros with Applications to Microbiome Data

This paper is motivated by the recent interest in the analysis of high dimensional microbiome data. A key feature of this data is the presence of ‘structural zeros’ which are microbes missing from an observation vector due to an underlying biological process and not due to error in measurement. Typical notions of missingness are insufficient to model these structural zeros. We define a general ...

متن کامل

Using Neural Networks with Limited Data to Estimate Manufacturing Cost

Neural networks were used to estimate the cost of jet engine components, specifically shafts and cases. The neural network process was compared with results produced by the current conventional cost estimation software and linear regression methods. Due to the complex nature of the parts and the limited amount of information available, data expansion techniques such as doubling-data and data-cr...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ژورنال

عنوان ژورنال: Journal of statistical theory and practice

سال: 2022

ISSN: ['1559-8616', '1559-8608']

DOI: https://doi.org/10.1007/s42519-021-00230-y