<?xml version="1.0" encoding="utf-8"?>
<journal>
<title>Journal of Health and Biomedical Informatics</title>
<title_fa>مجله انفورماتیک سلامت و زیست پزشکی</title_fa>
<short_title>jhbmi</short_title>
<subject>Medical Sciences</subject>
<web_url>http://jhbmi.ir</web_url>
<journal_hbi_system_id>1</journal_hbi_system_id>
<journal_hbi_system_user>admin</journal_hbi_system_user>
<journal_id_issn>2423-3870</journal_id_issn>
<journal_id_issn_online>2423-3498</journal_id_issn_online>
<journal_id_pii></journal_id_pii>
<journal_id_doi></journal_id_doi>
<journal_id_iranmedex></journal_id_iranmedex>
<journal_id_magiran></journal_id_magiran>
<journal_id_sid></journal_id_sid>
<journal_id_nlai></journal_id_nlai>
<journal_id_science></journal_id_science>
<language>fa</language>
<pubdate>
	<type>jalali</type>
	<year>1399</year>
	<month>3</month>
	<day>1</day>
</pubdate>
<pubdate>
	<type>gregorian</type>
	<year>2020</year>
	<month>6</month>
	<day>1</day>
</pubdate>
<volume>7</volume>
<number>1</number>
<publish_type>online</publish_type>
<publish_edition>1</publish_edition>
<article_type>fulltext</article_type>
<articleset>
	<article>


	<language>fa</language>
	<article_id_doi></article_id_doi>
	<title_fa>ارائه یک روش خوشه‌بندی گراف-محور جهت شناسایی جمعیت‌های سلولی در داده‌های توالی‌یابی RNA سلول-منفرد</title_fa>
	<title>A Graph-Based Clustering Approach to Identify Cell Populations in Single-Cell RNA Sequencing Data</title>
	<subject_fa>بیوانفورماتیک</subject_fa>
	<subject>Bioinformatics</subject>
	<content_type_fa>پژوهشي اصیل</content_type_fa>
	<content_type>Original Article</content_type>
	<abstract_fa>&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family:Tahoma;&quot;&gt;&lt;strong&gt;&lt;span style=&quot;color:black;&quot;&gt;مقدمه:&lt;/span&gt;&lt;/strong&gt; &lt;span style=&quot;color:black;&quot;&gt;استفاده از فناوری &amp;laquo;توالی&amp;shy; یابی &lt;/span&gt;&lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;color:black;&quot;&gt;&lt;span style=&quot;font-size:11.0pt;&quot;&gt;RNA&lt;/span&gt;&lt;/span&gt;&lt;/span&gt; &lt;span style=&quot;color:black;&quot;&gt;سلول-منفرد&amp;raquo; باعث شناخت بهتر ساختارهای سلولی شده و داده&#8204;های با وضوح بسیار بالایی از بیان ژن&#8204;های مختلف هر سلول را در یک زمان واحد ارائه می&#8204;دهد. یکی از زمینه&amp;shy; های پرکاربرد در این حوزه، خوشه&amp;shy;بندی داده&amp;shy; ها بر اساس ژن&#8204;های بیان شده است که بعضاً منتج به شناسایی جمعیت&amp;shy; های سلولی جدید می&amp;shy;گردد. عملکرد روش&amp;shy; های پیشنهادی عمدتاً به شکل جمعیت&amp;shy; ها و ابعاد داده&amp;shy; ها بستگی دارد؛ لذا توسعه یک روش که بتواند فارغ از این موانع به شناسایی جمعیت&amp;shy; های سلولی بپردازد، بسیار مهم است. &lt;/span&gt;&lt;br&gt;
&lt;strong&gt;&lt;span style=&quot;color:black;&quot;&gt;روش:&lt;/span&gt;&lt;/strong&gt;&lt;span style=&quot;color:black;&quot;&gt; در روش پیشنهادی&amp;nbsp;که یک روش کتابخانه&amp;shy; ای بود، ابتدا تعداد جمعیت&lt;/span&gt;&lt;span style=&quot;color:black;&quot;&gt;&#8204;&lt;/span&gt;&lt;span style=&quot;color:black;&quot;&gt;های سلولی تخمین زده&lt;/span&gt; &lt;span style=&quot;color:black;&quot;&gt;شد. این تخمین از آن جهت اهمیت دارد که در دنیای واقعی، اطلاعات اولیه مثل تعداد و نوع جمعیت&lt;/span&gt;&lt;span style=&quot;color:black;&quot;&gt;&#8204;&lt;/span&gt;&lt;span style=&quot;color:black;&quot;&gt;های سلولی در دسترس نیست. سپس با استفاده از یک کرنل گاوسی مبتنی بر گراف، ضمن کاهش ابعاد مسئله، اقدام به شناسایی جمعیت&lt;/span&gt;&lt;span style=&quot;color:black;&quot;&gt;&#8204;&lt;/span&gt;&lt;span style=&quot;color:black;&quot;&gt;های سلولی با روش خوشه&#8204;بندی &lt;/span&gt;&lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-size:10.0pt;&quot;&gt;kmeans++&lt;/span&gt;&lt;/span&gt; &lt;span style=&quot;color:black;&quot;&gt;شد.&lt;/span&gt;&lt;span style=&quot;font-family:B Mitra;&quot;&gt;&lt;/span&gt;&lt;br&gt;
&lt;strong&gt;&lt;span style=&quot;color:black;&quot;&gt;نتایج&lt;/span&gt;&lt;/strong&gt;&lt;strong&gt;:&lt;/strong&gt; نتایج پیاده&#8204;سازی نشان داد که روش پیشنهادی می&#8204;تواند نسبت به سایر روش&#8204;های یادگیری ماشین ارائه شده در این زمینه، بهبود قابل قبولی را حاصل کند. به عنوان مثال برای معیار &lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-size:11.0pt;&quot;&gt;ARI&lt;/span&gt;&lt;/span&gt;، مقادیر 100، 93/47 و 84/69 به ترتیب برای مجموعه داده&#8204;های سلول-منفرد &lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-size:11.0pt;&quot;&gt;Kolod&lt;/span&gt;&lt;/span&gt;، &lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-size:11.0pt;&quot;&gt;Buettner&lt;/span&gt;&lt;/span&gt; و &lt;span dir=&quot;LTR&quot;&gt;&lt;span style=&quot;font-size:11.0pt;&quot;&gt;Usoskin&lt;/span&gt;&lt;/span&gt; حاصل شد.&lt;span dir=&quot;LTR&quot;&gt;&lt;/span&gt;&lt;br&gt;
&lt;strong&gt;نتیجه&amp;shy; گیری:&lt;/strong&gt; روش پیشنهادی بدون هیچ اطلاعات اولیه در مورد تعداد و نوع جمعیت&#8204;های سلولی و فارغ از ابعاد بالای مسئله، می&amp;shy;تواند اقدام به خوشه&#8204;بندی و در نتیجه شناسایی جمعیت&#8204;های سلولی با دقت و کیفیت بالایی نماید.&lt;/span&gt;&lt;span dir=&quot;LTR&quot;&gt;&lt;/span&gt;&lt;/div&gt;</abstract_fa>
	<abstract>&lt;div style=&quot;text-align: justify;&quot;&gt;&lt;span style=&quot;font-family:Tahoma;&quot;&gt;&lt;strong&gt;Introduction:&lt;/strong&gt; The emergence of single-cell RNA-sequencing (scRNA-seq) technology has provided new information about the structure of cells, and provided data with very high resolution of the expression of different genes for each cell at a single time. One of the main uses of scRNA-seq is data clustering based on expressed genes, which sometimes leads to the detection of rare cell populations. However, the results of the proposed methods mainly depend on the shape of the cell populations and the dimensions of the data. Therefore, it is very important to develop a method that can identify cell populations regardless of these obstacles.&lt;br&gt;
&lt;strong&gt;Method:&lt;/strong&gt; In the proposed method, which was a library method, at first, the number of clusters (cell populations) was estimated. Estimating the number of clusters is important because in the real world, basic information such as the number and type of cell populations is not available. Thereafter, using a graph-based Gaussian kernel, while reducing the dimensions of the problem, the cell populations were identified by means of the kmeans++ clustering.&lt;br&gt;
&lt;strong&gt;Results:&lt;/strong&gt; The results of the implementation showed that the proposed method can achieve an acceptable improvement compared to other machine learning methods presented in this regard. For example, for the ARI criterion, values of 100, 93.47 and 84.69 were obtained for Kolod, Buettner, and Usoskin single-cell data sets, respectively.&lt;br&gt;
&lt;strong&gt;Conclusion&lt;/strong&gt;: The proposed method can cluster and thus identify cell populations with high accuracy and quality without having any basic information about the number and type of cell populations, regardless of the high dimensions of the problem.&lt;/span&gt;&lt;/div&gt;</abstract>
	<keyword_fa>توالی‌یابی RNA سلول-منفرد, خوشه‌بندی, شناسایی جمعیت‌های سلولی, کرنل گاوسی مبتنی بر گراف</keyword_fa>
	<keyword>Single-cell RNA-sequencing, Clustering, Identification of Cell Populations, Graph-based Gaussian Kernel</keyword>
	<start_page>60</start_page>
	<end_page>72</end_page>
	<web_url>http://jhbmi.ir/browse.php?a_code=A-10-581-1&amp;slc_lang=fa&amp;sid=1</web_url>


<author_list>
	<author>
	<first_name>Amin</first_name>
	<middle_name></middle_name>
	<last_name>Einipour</last_name>
	<suffix></suffix>
	<first_name_fa>امین</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>عینی پور</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>a.einipour@gmail.com</email>
	<code>10031947532846005463</code>
	<orcid>10031947532846005463</orcid>
	<coreauthor>No</coreauthor>
	<affiliation>Ph.D. Student in Computer Engineering, Computer Engineering Dept., Faculty of Engineering, Dezful Branch, Islamic Azad University, Dezful, Iran</affiliation>
	<affiliation_fa>گروه مهندسی کامپیوتر، واحد دزفول، دانشگاه آزاد اسلامی، دزفول، ایران</affiliation_fa>
	 </author>


	<author>
	<first_name>Mohammad</first_name>
	<middle_name></middle_name>
	<last_name>Mosleh</last_name>
	<suffix></suffix>
	<first_name_fa>محمد</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>مصلح</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>mosleh@iaud.ac.ir</email>
	<code>10031947532846005464</code>
	<orcid>10031947532846005464</orcid>
	<coreauthor>Yes
</coreauthor>
	<affiliation>Ph.D. in Computer Engineering, Assistant Professor, Computer Engineering Dept., Faculty of Engineering, Dezful Branch, Islamic Azad University, Dezful, Iran</affiliation>
	<affiliation_fa>گروه مهندسی کامپیوتر،واحد دزفول، دانشگاه آزاد اسلامی، دزفول، ایران</affiliation_fa>
	 </author>


	<author>
	<first_name>Karim</first_name>
	<middle_name></middle_name>
	<last_name>Ansari-Asl </last_name>
	<suffix></suffix>
	<first_name_fa>کریم</first_name_fa>
	<middle_name_fa></middle_name_fa>
	<last_name_fa>انصاری اصل</last_name_fa>
	<suffix_fa></suffix_fa>
	<email>karimansari@scu.ac.ir</email>
	<code>10031947532846005465</code>
	<orcid>10031947532846005465</orcid>
	<coreauthor>No</coreauthor>
	<affiliation>Ph.D. in Biomedical Engineering, Associate Professor, Electrical Engineering Dept., Faculty of Engineering, Shahid Chamran University of Ahvaz, Ahvaz, Iran</affiliation>
	<affiliation_fa>گروه مهندسی برق، دانشکده مهندسی، دانشگاه شهید چمران اهواز، اهواز، ایران</affiliation_fa>
	 </author>


</author_list>


	</article>
</articleset>
</journal>
