<?xml version="1.0" encoding="utf-8"?>
<journal>
<title>Journal of Health and Biomedical Informatics</title>
<title_fa>مجله انفورماتیک سلامت و زیست پزشکی</title_fa>
<short_title>jhbmi</short_title>
<subject>Medical Sciences</subject>
<web_url>http://jhbmi.ir</web_url>
<journal_hbi_system_id>1</journal_hbi_system_id>
<journal_hbi_system_user>admin</journal_hbi_system_user>
<journal_id_issn>2423-3870</journal_id_issn>
<journal_id_issn_online>2423-3498</journal_id_issn_online>
<journal_id_pii></journal_id_pii>
<journal_id_doi></journal_id_doi>
<journal_id_iranmedex></journal_id_iranmedex>
<journal_id_magiran></journal_id_magiran>
<journal_id_sid></journal_id_sid>
<journal_id_nlai></journal_id_nlai>
<journal_id_science></journal_id_science>
<language>fa</language>
<pubdate>
	<type>jalali</type>
	<year>1397</year>
	<month>3</month>
	<day>1</day>
</pubdate>
<pubdate>
	<type>gregorian</type>
	<year>2018</year>
	<month>6</month>
	<day>1</day>
</pubdate>
<volume>5</volume>
<number>1</number>
<publish_type>online</publish_type>
<publish_edition>1</publish_edition>
<article_type>fulltext</article_type>
<articleset>
	<article>


	<language>fa</language>
	<article_id_doi></article_id_doi>
	<title_fa>تشخیص نوع لوسمی به کمک یادگیری ماشین: کاهش ابعاد و متوازن‌سازی</title_fa>
	<title>Diagnosis of Leukemia Type by Machine Learning: Dimension Reduction and Balancing</title>
	<subject_fa>داده کاوی</subject_fa>
	<subject>Data Mining</subject>
	<content_type_fa>پژوهشي اصیل</content_type_fa>
	<content_type>Original Article</content_type>
	<abstract_fa>&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family:tahoma;&quot;&gt;&lt;strong&gt;&lt;span style=&quot;color:black;&quot;&gt;مقدمه:&lt;/span&gt;&lt;/strong&gt; ترکیب تکنیک&#8204;های محاسباتی هوش مصنوعی و داده&#8204;کاوی در پزشکی به پیشرفت&#8204;های قابل توجهی در پیش&#8204;گیری و تشخیص بیماری&#8204;ها منجر شده &#8204;است. در تشخیص لوسمی حاد از اطلاعات ژنتیکی، مدل&#8204;های پیچیده&#8204;ای تاکنون ارائه شده؛ اما نتایج قابل توجهی را ارائه نکرده است. این مطالعه به تشخیص نوع سرطان خون با بررسی محدوده گسترده&#8204;ای از توابع پارامتری و غیرپارامتری و به منظور افزایش قابلت تعمیم آن&#8204;ها در یادگیری با استخراج ویژگی&#8204;های ذاتی کم&#8204;تر از نمونه&#8204;ها می&#8204;پردازد.&lt;br&gt;
&lt;strong&gt;&lt;span style=&quot;color:black;&quot;&gt;روش:&lt;/span&gt;&lt;/strong&gt; این مطالعه توصیفی- تحلیلی، بر روی داده&#8204;های &lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-size:11.0pt;&quot;&gt;Leukemia1&lt;/span&gt;&lt;/span&gt; از دانشگاه واندربیلت آمریکا انجام شد. این داده&#8204;ها مجموعه&#8204;ای از نمونه&#8204;های مغز استخوان و خون بیماران لوسمی است که برای طبقه&#8204;بندی بر اساس سه زیر گروه سرطان خون &lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-size:11.0pt;&quot;&gt;ALL B&lt;/span&gt;&lt;/span&gt;&lt;span dir=&quot;LTR&quot;&gt;-&lt;/span&gt;&lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-size:11.0pt;&quot;&gt;cell&lt;/span&gt;&lt;/span&gt;، &lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-size:11.0pt;&quot;&gt;ALL T-cell&lt;/span&gt;&lt;/span&gt; و &lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-size:11.0pt;&quot;&gt;AML&lt;/span&gt;&lt;/span&gt; استفاده می&#8204;شود. دسته&#8204;بندی پارامتری با الگوریتم&#8204;های خطی، بیز ساده، فاصله اقلیدسی، نزدیک&#8204;ترین میانگین، تطبیق قالب و دسته&#8204;بندی غیرپارامتری با الگوریتم&#8204;های تخمین&#8204;گرهای پایه، هسته، &lt;span dir=&quot;LTR&quot;&gt;k&lt;/span&gt; -همسایه نزدیک&#8204;تر و &lt;span dir=&quot;LTR&quot;&gt;k&lt;/span&gt; -همسایه نزدیک&#8204;تر مبتنی برهسته انجام گردید.&lt;br&gt;
&lt;strong&gt;&lt;span style=&quot;color:black;&quot;&gt;نتایج&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;:&lt;/strong&gt; با در نظر گرفتن تمامی ویژگی&#8204;ها بهترین الگوریتم نزدیک&#8204;ترین میانگین بود که به دقت پیش&#8204;بینی 92/86&#8204;% رسید. با اعمال روش کاهش ویژگی &lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-size:11.0pt;&quot;&gt;PCA&lt;/span&gt;&lt;/span&gt;، باز هم بهترین نتیجه مربوط به الگوریتم نزدیک&#8204;ترین میانگین بود و با متوسط تعداد ویژگی 6/8 به دقت 96% دست یافت. در نهایت با متوازن&#8204;سازی داده&#8204;های &lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-size:11.0pt;&quot;&gt;Leukemia1&lt;/span&gt;&lt;/span&gt;، متوسط تعداد ویژگی و دقت توسط الگوریتم درجه 2 به ترتیب 41/5 و 98/59 حاصل گردید.&lt;br&gt;
&lt;strong&gt;نتیجه&#8204;گیری:&lt;/strong&gt; نتایج به دست آمده بیانگر اثربخشی استخراج ویژگی&#8204;های ذاتی و متوازن&#8204;سازی در بهبود دقت مدل مبتنی بر قاعده بیز و برتری آن نسبت به مدل&#8204;های پیچیده&#8204;تر کنونی می&#8204;باشد.&lt;/span&gt;&lt;br&gt;
&amp;nbsp;&lt;/div&gt;
</abstract_fa>
	<abstract>&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;strong&gt;Introduction:&lt;/strong&gt; Combination of artificial intelligence and data mining has been resulted to considerable progress in the prevention and diagnosis of diseases. Complex models have been proposed for the diagnosis of acute leukemia from genetic information, but significant results have not been achieved. This study aimed to predict the type of blood cancer by examining a wide range of parametric and non-parametric methods and to increase the generalization of learning by extracting fewer essential features.&lt;br&gt;
&lt;strong&gt;Methods:&lt;/strong&gt; This descriptive and analytical study used Leukemia1 dataset from the Vanderbilt University of USA. This dataset contains a set of bone marrow and blood samples of patients having leukemia used for classification based on three subgroups of leukemia, namely ALL B-cell, ALL T-cell and AML. Parametric classification including linear algorithms, Na&amp;iuml;ve Bayes, Euclidean distance, nearest average, template matching as well as non-parametric classification using basic estimator algorithms, kernel, k-nearest neighbors and k-nearest neighbors based on the kernel has been used.&lt;br&gt;
&lt;strong&gt;Results:&lt;/strong&gt; Considering all features, the best method was nearest mean prediction method achieving the accuracy of 92.86%. By applying the PCA feature reduction method, too, the best result was related to the nearest mean algorithm and by average number of features of 6.8, the accuracy became 96%. Finally, using data-balancing methods and quadratic algorithm resulted in the average number of features and the accuracy of 5.41 and 98.59% respectively.&lt;br&gt;
&lt;strong&gt;Conclusion&lt;/strong&gt;: The results show the effectiveness of essential features extraction in improving the accuracy of Bayes-based models and its preference over the existing complex models.&lt;br&gt;
&amp;nbsp;&lt;/div&gt;
</abstract>
	<keyword_fa>داده‌های ژنتیکی, تشخیص نوع سرطان خون, داده‌کاوی, متوازن‌سازی داده‌ها, کاهش ابعاد</keyword_fa>
	<keyword>Genetics data, Diagnosis of type of blood cancer, Data mining, Data balancing, Dimension reduction.</keyword>
	<start_page>25</start_page>
	<end_page>34</end_page>
	<web_url>http://jhbmi.ir/browse.php?a_code=A-10-346-1&amp;slc_lang=fa&amp;sid=1</web_url>


<author_list>
	<author>
	<first_name>Mohamadreza</first_name>
	<middle_name></middle_name>
	<last_name>Pajoohan</last_name>
	<suffix></suffix>
	<first_name_fa>محمد رضا</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>پژوهان</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>pajoohan@yazd.ac.ir</email>
	<code>10031947532846003702</code>
	<orcid>10031947532846003702</orcid>
	<coreauthor>Yes
</coreauthor>
	<affiliation>Ph.D in computer Engineering, Assistant Professor of Computer Engineering, Department of Computer Engineering Dept., Yazd University, Yazd, Iran.</affiliation>
	<affiliation_fa>دکتری مهندسی کامپیوتر، استادیار، گروه مهندسی کامپیوتر، دانشگاه یزد، یزد، ایران</affiliation_fa>
	 </author>


	<author>
	<first_name>Zeinab</first_name>
	<middle_name></middle_name>
	<last_name>Gharaati </last_name>
	<suffix></suffix>
	<first_name_fa>زینب</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>قرائتی</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>zeinabgharaati@gmail.com</email>
	<code>10031947532846003703</code>
	<orcid>10031947532846003703</orcid>
	<coreauthor>No</coreauthor>
	<affiliation></affiliation>
	<affiliation_fa>دانشجوی کارشناسی ارشد مهندسی کامپیوتر، گروه مهندسی کامپیوتر، دانشگاه یزد، یزد، ایران</affiliation_fa>
	 </author>


</author_list>


	</article>
</articleset>
</journal>
