학술논문
베이지안 부분집합 회귀를 이용한 고차원 분할표 분석
이용수 11
- 영문명
- The High-dimensional Contingency Table Analysis using Bayesian Subset Regression
- 발행기관
- 한국자료분석학회
- 저자명
- 전수영(Sooyoung Cheon)
- 간행물 정보
- 『Journal of The Korean Data Analysis Society (JKDAS)』Vol.19 No.4, 1841~1852쪽, 전체 12쪽
- 주제분류
- 자연과학 > 통계학
- 파일형태
- 발행일자
- 2017.08.31
4,240원
구매일시로부터 72시간 이내에 다운로드 가능합니다.
이 학술논문 정보는 (주)교보문고와 각 발행기관 사이에 저작물 이용 계약이 체결된 것으로, 교보문고를 통해 제공되고 있습니다.
국문 초록
최근 데이터의 양이 증가하면서 분할표의 변수의 수도 증가하여 변수들의 고차 상호작용효과에 관심이 많아지게 되었다. 하지만 변수의 수가 관측치 수만큼 커짐에 따라 과적합의 문제점이 발생하는 경우가 많다. 이를 극복하기 위해 본 연구는 베이지안 부분집합 회귀(Bayesian subset regression, BSR) 방법을 이용하여 고차원 분할표의 포아송 로그 선형 모형에서 고차 상호 작용효과 변수선택 방법을 제안하고자 한다. 제안된 BSR 방법에서 제시하는 최대 사후 모형은 최소 확장 베이지안 정보기준(extended Bayesian information criterion) 모형과 근사적으로 동등하다. BSR 사후분포로부터 효율적인 표본추출을 위해 확률적 근사 몬테카를로(stochastic approximation Monte Carlo) 알고리즘을 이용한다. 제안된 BSR 방법의 우수성을 보기 위해, 세 개의 분할표 자료에 대해 BSR 방법을 기존의 벌점화우도 방법들인 리지(ridge), 라소(lasso), 엘라스틱넷(elastic net) 방법들과 비교를 한다. 비교 결과 모든 예제에서 BSR에 의해 선택된 모형들이 변수의 수가 다른 방법에 비해 작으면서 가장 작은 제곱근 하나남기기 교차검증(root leave-one-out crossvalidation)값을 가짐에 따라 BSR 방법이 벌점화우도 방법들보다 우수함을 알 수 있었다. 또한 벌점화우도 방법들은 분할표의 차원이 커질수록 결과가 좋지 않았다.
영문 초록
As the amount of data has increased recently, the number of variables in the contingency table has increased, and the interest in the higher order interaction effect of the variables has increased. However, as the number of variables is slightly smaller than the number of observations, there is often an overfitting problem. This article proposes a method for selecting high-order interaction effect variables in the Poisson log linear model of high-dimensional contingency tables using Bayesian subset regression (BSR) method. The stochastic approximation Monte Carlo algorithm has been used for efficient sampling from the BSR posterior. In order to show the superiority of the proposed BSR method, we compared BSR with ridge, lasso and elastic net methods with three contingency table data. The results show that the BSR method is superior in all examples, and the models selected by BSR have the smallest root leave-one-out cross-validation value with a small number of variables. Also, it can be seen that the larger the dimension, the worse the results of the popular penalized likelihood methods are.
목차
1. 소개
2. 분할표에서의 베이지안 부분집합 회귀
3. BSR 표본 추출을 위한 SAMC 알고리즘
4. 실 자료 분석
5. 결론
키워드
해당간행물 수록 논문
- 학습접근성향과 회계교육의 온라인 학습성과에 관한 연구
- 공적분 관계 및 경제적 영향요인을 고려한 재산범죄 발생 예측
- IPA를 통한 대도시 관문시설의 이미지 평가
- College Life Adjustment, Grit, and Self-leadership among Nursing Students
- 지역사회노인의 인지기능과 정서수준에 대한 치매예방통합프로그램의 효과
- 간호대학생의 공감역량, 감정성향, 실습지에서 지각한 약자괴롭힘이 전공적응에 미치는 영향
- 투자심리가 장중 KOSPI200 선물수익률에 미치는 영향
- 영과잉 계수형 자료 분석을 위한 허들 나무모형 구축
- ESG 투자전략의 성과분석
- 2단계 집락추출법에 의한 승법 무관양적속성 모형
- 대칭적 J 측도에 의한 기본적인 연관성 평가 기준의 대체 방안
- 간호대학생의 지각된 스트레스와 삶의 질의 관계에서 자아존중감의 매개효과
- Economic Policy Uncertainty and Stock Market: Evidence from Korea
- Effect of Store Environments on Tourists Impulsive Buying, Self-control and Shopping Satisfaction, Loyalty
- Dynamic Spillover Effects of Dow Jones Islamic Market Indices Across Sectors
- Proposition of Modified Balance Cross Entropy in Association Rule Mining
- 간호윤리 교육에서 토론학습이 간호대학생의 비판적 사고성향, 윤리적 가치관, 도덕 판단력에 미치는 효과
- 도시와 농촌지역 성인의 비만과 개인적, 사회적 환경 요인의 관련성
- 도시지역 재가노인의 인지기능과 관련요인 : 노인돌봄기본서비스를 제공받는 대상자 중심으로
- 원전의 원자로 상태에 따른 소비자 후생변화 연구
- Effects of the Physical Environment on Visitors’ Satisfaction, Revisiting, and Recommendation: Focused on Yangyang Song-i Festival
- A Study on Prediction Comparison of Kriging and Cokriging using PCA
- 콜모고로프-스미르노프 통계량을 이용한 구간형 심볼릭 반응변수 의사결정나무 연구
- 해양스포츠 참여자의 참여동기가 참여 후 행동에 미치는 영향에서 몰입의 매개효과
- 베이지안 부분집합 회귀를 이용한 고차원 분할표 분석
- 브랜드 경험이 즐거움과 체류의도에 미치는 영향 : 백화점을 대상으로
- 부적응적 자기초점주의와 사회불안의 관계: 정서조절곤란과 안전행동의 매개효과
- 간호대학생의 자아탄력성과 비판적사고 성향간의 관계에서 셀프리더십의 매개효과
- 한국주식시장에서 주식 수익률의 횡단면 분석: 가장 적합한 위험요인 조합
- 2006-2015 한국노동패널조사를 이용한 노동조합의 대표성 분석
- SERVQUAL 모형을 적용한 지역사회 암 환자의 서비스 만족도 분석
- 불완전 삼원 분할표에서 범행동기 미상 추정을 위한 모형 선택에 대한 연구
- 시간대별 전력량을 이용한 장단기 연계 모형 구축에 관한 연구
- Global Democracy and Global Peace: Vector Autoregression Granger Causality Analysis
- Estimating the Parameter of a Exponential Distribution under Multiply Type II Censored Competing Risks Data
- 협력적 필터링에서 응답수와 순위일치도와의 모형에 대한 연구
- 성향점수 및 다수준 로지스틱 회귀모형을 이용한 장애인 경제활동의 지역요인
- 영화 투자자를 위한 흥행성과 예측지표 발굴
- 전력수요의 빈도별 시계열 특성에 따른 예측 모형 구축에 관한 연구
- 다중회귀분석을 이용한 메이저리그 승률의 모형구축과 예측
- 간호대학생의 감염예방 표준주의 지침 수행도에 미치는 영향요인 : 표준주의 지침에 대한 지식, 인식 및 감염관리 환경을 중심으로
- 중소기업금융 활성화를 위한 시장여건과 정책방안에 관한 연구
- 페이스북 댓글을 통해 살펴본 대구·경북(TK) 촛불집회
- 스모그와 주식수익률 : 중국시장에 대한 분석
- 한국어판 간호사 직무착근도 도구의 신뢰도와 타당도 검증
참고문헌
교보eBook 첫 방문을 환영 합니다!
신규가입 혜택 지급이 완료 되었습니다.
바로 사용 가능한 교보e캐시 1,000원 (유효기간 7일)
지금 바로 교보eBook의 다양한 콘텐츠를 이용해 보세요!