본문 바로가기

추천 검색어

실시간 인기 검색어

학술논문

구간형 데이터 검정법을 이용한 유전자 탐색에 관한 연구

이용수 17

영문명
A Study on Gene Search Using Test for Interval Data
발행기관
한국자료분석학회
저자명
이성건(Seong-Keon Lee)
간행물 정보
『Journal of The Korean Data Analysis Society (JKDAS)』Vol.20 No.6, 2805~2812쪽, 전체 8쪽
주제분류
자연과학 > 통계학
파일형태
PDF
발행일자
2018.12.31
4,000

구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.

1:1 문의
논문 표지

국문 초록

본 연구는 생명정보학(bio-informatics) 분야 중, 특정 병에 관련된 유전자 위치를 찾고자 DNA 시퀀싱(DNA sequencing) 방법을 이용한 메틸화(methylation) 데이터의 분석에 관한 것이다. 반복적인 시퀀싱 과정을 통해 도출되는 메틸화 여부 자료를 비율로 표현한 메틸화 점수는 0과 1사이의 값을 가지게 된다. 이러한 데이터에 집단별 메틸화 점수의 차이를 검토하기 위해 t-검정을 단순히 적용하는 것은 정규분포의 가정에 위배된다. 또한 메틸화 점수 생성과정에서 시퀀싱의 반복 수에 따라 결과가 달라 질 수 있으므로 이러한 오차를 고려해서 분석할 수 있는 방법도 필요하다. 이에 본 논문에서는 메틸화 데이터를 하나의 숫자 데이터가 아닌 불확실성을 포함하는 구간형(interval) 데이터로 변환하여 분석하는 심볼릭 데이터 분석(symbolic data analysis) 및 구간형 K-S 검정법을 적용하였다. 또한 구간형 데이터로 변환하는 과정에서 정규분포를 이용하지 않고 베타분포를 이용하여 메틸화 점수의 특성을 반영하여 분석할 수 있게 하였다. 자료분석을 위하여 174명의 실제 암환자 및 정상인들의 DNA 시퀀싱 데이터를 이용하여 제안한 방법의 성질을 살펴보았다. t-검정은 위치모수에 관한 검정만 가능한 반면, 구간형 K-S 통계량은 구간자료에 대해 위치모수뿐만 아니라 분포함수의 이질성에 검정할 수 있으므로 t-검정이 놓칠 수 있는 유의미한 유전자 위치를 찾아낼 수 있음을 확인하였다.

영문 초록

The methylation score, expressed as a percentage of the methylation status data derived from the iterative sequencing process, has a value between 0 and 1. It is contrary to the assumption of normal distribution that simply applying the t-test to examine the difference in population-specific methylation scores in these data. In addition, since the result may vary depending on the number of repetitions of sequencing in the process of methylation score generation, a method that can analyze such errors is also necessary. In this paper, we introduce the symbolic data analysis and the interval K-S test method which convert observation data into interval data including uncertainty rather than one numerical data. In addition, it is possible to analyze the characteristics of methylation score by using Beta distribution without using normal distribution in the process of converting into interval data. For the data analysis, the nature of the proposed method was examined using sequencing data of actual patients and normal persons. While the t-test is only possible for the location test, it is found that the interval type K-S statistic can be used to test not only the location parameter but also the heterogeneity of the distribution function.

목차

1. 서론
2. 구간형 데이터에 대한 K-S 검정
3. 사례 데이터
4. 결론
References

키워드

해당간행물 수록 논문

참고문헌

교보eBook 첫 방문을 환영 합니다!

신규가입 혜택 지급이 완료 되었습니다.

바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!

교보e캐시 1,000원
TOP
인용하기
APA

이성건(Seong-Keon Lee). (2018).구간형 데이터 검정법을 이용한 유전자 탐색에 관한 연구. Journal of The Korean Data Analysis Society (JKDAS), 20 (6), 2805-2812

MLA

이성건(Seong-Keon Lee). "구간형 데이터 검정법을 이용한 유전자 탐색에 관한 연구." Journal of The Korean Data Analysis Society (JKDAS), 20.6(2018): 2805-2812

결제완료
e캐시 원 결제 계속 하시겠습니까?
교보 e캐시 간편 결제