본문 바로가기

it자격증 준비/ADsP

➜ [ADsP/34회] 3과목 데이터 분석 기출문제 복원 -2

반응형

 

 
 
 

토글
토글
토글
토글
토글
토글

 
 
 
35. 회귀분석에 대한 설명 중 가장 적절하지 못한 것은?

더보기

정답
성별과 같이 두집단으로 분류된 명목형자료는 회귀분석에서 독립변수로 사용할 수 없다.

해설
독립변수가 범주형변수일때 독립변수를 더미변수(Dummy Variable)로 변환하여 회귀분석을 수행한다. 더미변수란 어떤 속성이 존재할 경우 그 값을 1로, 존재하지 않을 경우 그 값을 0으로 코딩한 인위적 변수를 의미한다. 성별처럼 2개의 더미일 경우 여성 = 0, 남성 = 1이다.




36. 주성분분석의 내용 중 가장 적절하지 않은 것은?

더보기

정답
원래 변수를 선형결합할때 목표변수를 고려할 필요는 없다.

해설
주성분분석은 비지도학습으로 데이터의 구조와 패턴을 통해 이상치를 탐색 및 탐지에 사용된다. 주성분분석은 목표변수를 고려하여 목표변수를 잘 예측 또는 분류할 수 있는 선형결합으로 이루어진 몇 개의 주성분을 찾아내기 위함이다. 따라서 주성분분석 자체가 취종목적이 아니라 다른 통계적분석을 하기위한 사전 기초분석에 사용한다.




37. ARIMA 모형에 대한 설명 중 적절하지 않은 것은?

더보기

정답
ARIMA(p,d,q) 모형의 차수에서 p=0이면 IMA(d,p)모형이라 한다.

해설
ARIMA(p,d,q) 모형의 차수 p, d, q의 값에 따라 모형의 이름이 달라지게 된다. 차수 p는 AR모형과 관련있고, q는 MA모형과 관련있는 차수이다. P=0이면 IMA(d,q) 모형이라 부르고 이 모형을 d번 차분하면 MA(q) 모형이 된다.




38. 다음 중 공분산과 상관계수에 대한 설명 중 올바르지 않는 것은?

더보기

정답
공분산은 측정단위에 영향을 받지 않는다.

해설
공분산은 상관관계의 상승 혹은 하강하는 경향을 이해할 수 있으나 2개 변수의 측정단위의 크기에 따라 값이 달라지므로 상관분석을 통해 정도를 파악하기에는 부적절하다.




39. x



40. 앙상블 모형에 대한 설명으로 적절한 것은?

더보기

정답
앙상블 모형의 대표적인 방법으로 배깅, 부스팅이 있다.

해설
보팅의 경우 일반적으로 서로 다른 알고리즘을 가진 분류기를 결합하는 앙상블 방법이다. 배깅의 경우 각각의 분류기가 모두 같은 유형의 알고리즘 기반이지만, 데이터 샘플링을 서로 다르게 가져가면서 학습을 수행해 보팅을 수행하는 것이다. 대표적인 배깅방식이 랜덤포레스트 알고리즘이다. 하드보팅은 다수결의 원칙에 따라 분류한다.




41. KNN 알고리즘에 대한 설명으로 적절하지 않은 것은?

더보기

정답
K가 클수록 과대적합이 발생한다.

해설
K가 커지면 커질수록 안정적으로 분류하는 모형으로 만들고(과소적합), K가 작으면 작을수록 세부적으로 분류할 수 있는 모형(과대적합)을 만들 수 있다. K가 1에 가까울수록 모델이 복잡해지고 K가 커질수록 모델이 단순해진다.

 


42. x



43. 상관분석에 대한 설명으로 옳은 것은?

더보기

정답
피어슨 상관계수가 0일때 서로 선형관계가 없다.

해설
비율척도일때 피어슨의 상관계수를 사용한다. 스피어만상관계수는 비선형관계 파악이 가능하다.




44. 정상성에 대한 설명 중 적절하지 않는 것은?

더보기

정답
지수평활법은 최근 시계열에 평균을 구해 미래를 예측하는 방법이다.

해설
지수평활법은 전체 시계열자료를 이용하여 평균을 구하고 최근 시계열자료에 더 큰 가중치를 부여하는 방법이다.




45. 데이터 집합으로부터 크기가 같은 표본를 여러번 단순 임의 복원 추출하여 각 표본에 대해 분류기를 생성한 후 그 결과를 앙상블 하는 방법은 무엇이라 하는가?

더보기

랜덤포레스트




46. 원 데이터 집합으로부터 크기가 같은 표본을 여러 번 단순 임의 복원추출하여 부트스트랩 표본을 구성하는 과정에서 분류가 잘못된 데이터에 더 큰 가중을 주어 표본을 추출하는 방법은 무엇인가 ?

더보기

부스팅

 


47. x
 


48. x



49. 모집단에서 표본을 추출하여 모집단의 모수를 추측하는 과정에서 범위가 아니라 가장 참값이라고 여겨지는 하나의 모수를 택하는 것은?

더보기

점추정

 


50. x
 
 
 
 

  ⬇️ 간호사출신 개발자와의 커피챗을 원하신다면? ⬇️

헤론헬스정보시스템, 소프트웨어 개발 '두슬' 님과 1:1 커피챗 시작

커피챗

share.coffeechat.kr




반응형