[우리 학교 이런 학과] 수많은 데이터에서 의미 있는 정보를 찾아내 문제를 해결한다
수많은 데이터에서 의미 있는 정보를 찾아내 문제를 해결한다
상경대학 응용통계학과
우리는 일상 속에서 수많은 데이터를 접하며 살아간다. 스포츠 경기 기록이나 복권 당첨, 임상 시험, 여론 조사, 날씨 정보 등 삶 속에서 접하는 많은 것들이 일종의 데이터로 통계학의 연구 대상이 될 수 있다. 통계학은 단순히 숫자를 분석하거나 그래프를 만드는 것이 아니라, 복잡한 데이터에서 중요한 정보를 추출하고 이를 바탕으로 미래를 예측하거나 의사결정을 내리는 과정을 연구하는 학문이다. 가령 새로운 약이 효과가 있는지 확인하거나 홍수 피해를 줄이기 위해 제방의 적절한 높이를 결정할 때도 통계학은 매우 중요한 역할을 담당한다.
이렇게 삶의 여러 가지 문제를 통계적으로 해결하기 위해서는 정확한 데이터 수집과 적절한 분석 능력이 필수적으로 요구된다. 그렇기 때문에 응용통계학(Applied Statistics)에서는 수학적 모델링, 데이터 분석 방법론, 머신러닝/딥러닝과 같은 다양한 과학적 도구를 사용하고 있다.
구체적으로 응용통계학과에서는 어떠한 교과목을 배우고 주로 어떤 분야를 연구하는지, 또한 우리 대학교 응용통계학과는 어떤 특성이 있는지 강상욱 학과장이 들려주는 응용통계학과에 대한 A to Z를 알아보자.
Q. 빅데이터 시대에 통계학은 어떤 역할을 하나요?
오늘날 우리는 ‘빅데이터’라는 용어를 자주 듣습니다. 이는 인터넷이나 소셜 미디어 같은 곳에서 매 순간 엄청난 양의 데이터가 생성된다는 것을 의미합니다. 이러한 방대하고 비정형화된 데이터를 제대로 분석하고 활용하지 않으면 의미가 없기 때문에 통계학은 이 데이터를 분석해 유용한 정보를 찾아내는 데 필수적인 역할을 합니다.
일례로 우리가 인터넷에서 검색을 하거나 쇼핑을 하는 기록들이 모두 데이터 형태로 저장되는데, 이런 방대한 양의 데이터를 단순히 수집하는 것만으로는 의미가 없습니다. 중요한 것은 이 데이터를 올바르게 분석하고, 필요한 정보를 찾아내는 것인데, 응용통계학이 바로 그 일을 합니다. 즉, 응용통계학은 단순히 데이터를 다루는 것을 넘어 빅데이터 시대에 우리가 직면한 여러 문제를 해결하는 데 중요한 역할을 합니다.
Q. 실효성 있는 통계를 도출하기 위해서는 데이터와 표본이 중요할 것 같습니다. 빅데이터와 AI 시대에 데이터의 편향성을 해결할 수 있는 방법이 있는지 궁금합니다.
데이터의 편향성을 해결하는 것은 올바른 결과를 얻기 위해 매우 중요한 문제입니다. 편향된 데이터를 잘못 활용하면 잘못된 결론을 도출하거나 사회적 또는 윤리적으로 문제가 될 수 있습니다. 편향성을 해결할 수 있는 가장 이상적인 방법은 데이터 수집 단계에서부터 특정 편향성을 띠지 않도록 주의 깊게 데이터를 수집하는 것입니다.
실험 결과로부터 얻어지는 실험 데이터의 경우, 실험 설계를 적절하게 수행함으로써 이러한 편향성을 쉽게 제거할 수 있습니다. 따라서 적절한 실험 설계와 계획이 필수적이며 이러한 내용을 다루는 통계학 분야를 실험계획법이라고 합니다.
관찰 연구로부터 얻어지는 관찰 데이터의 경우, 편향성을 제거하는 것이 상대적으로 어려울 수 있습니다. 되도록 편향성을 최소화하도록 데이터를 수집하되 여러 이유로 불가피하게 편향이 발생한 경우에는 추가 데이터를 수집 또는 데이터 증강 기법을 통해 보충하거나 과도하게 수집된 데이터 수를 줄일 수 있습니다.
이러한 과정은 인과관계 추론 또는 데이터 통합 등의 분야에서 주로 다루며, 최근 빅데이터 시대에 많은 연구자들이 주목하고 있는 중요한 연구 주제입니다.
AI 모델의 경우 목적 함수를 계산할 때 데이터의 기여도를 분포에 따라 보정하거나 학습된 모델의 편향성을 분석한 뒤 후처리를 통해 모델의 신뢰도를 보정할 수 있으며, 이는 AI 분야에서 활발히 연구되고 있는 주요 분야 중 하나입니다. 또한, 최근에는 인간 피드백 기반 강화학습을 통해 원하지 않는 출력이 나오지 않도록 사후 학습을 수행하는 방법이 연구되고 있습니다.
Q. 응용통계학과에서는 주로 어떤 교과목을 배우나요?
필수 과목으로는 미분적분학, 선형대수, 프로그래밍, 수리통계학 등의 수업들이 있고, 이들은 심화 과목들을 수강하기 위한 기초가 됩니다. 이후 통계학 분야를 심화해서 공부하고 싶은 학생들은 회귀분석, 생존자료분석, 베이즈통계, 보험통계, 비모수통계, 통계적머신러닝 등의 과목을 선택해 통계학이 각 응용분야에서 어떻게 활용되는지 배울 수 있습니다.
데이터사이언스 분야를 심화해서 수강하고 싶은 학생들은 데이터마이닝, 딥러닝, 정보이론, 자료구조, 강화학습, 컴퓨터비전, 양자머신러닝 등을 포함한 다양한 데이터사이언스 과목들을 수강할 수 있습니다.
데이터 분석을 위한 프로그램들의 종류는 다양하며 목적에 맞게 활용할 수 있습니다. 그중 R과 파이썬(Python)은 사용자의 자유도가 높고, 오픈 소스 소프트웨어이기 때문에 학계 및 산업계의 연구용으로 많이 이용됩니다. R은 특히 통계 분석에 특화되어 있으며 파이썬은 머신러닝 분야에서 활용됩니다. 반면, SPSS와 SAS는 직접 프로그래밍할 필요가 없어 비전공자들도 쉽게 활용할 수 있습니다. 하지만 라이선스 비용이 있기 때문에 주로 상업용으로 사용됩니다.
Q. 우리 대학교 응용통계학과의 저력, 강점은 무엇인가요?
응용통계학과는 1967년 설립돼 국내에서 가장 긴 역사를 자랑하는 학과 중 하나입니다. 현재 19명의 교수진을 두고 있는데, 이는 국내 통계학과 중 가장 많은 수입니다. 2025년에는 2명의 교수가 추가로 임용될 예정이어서, 21명의 교수진을 갖춘 국내 유일의 통계학과가 될 전망입니다. 빅데이터 분석, 머신러닝, 인공지능, 양자정보학, 의료-바이오통계, 금융통계 등 데이터 사이언스 관련 분야의 다양한 전문가로 구성된 최상의 교수진은 우리 학과가 통계적 추론과 같은 통계학의 전통적 분야뿐만 아니라, 현대적이고 전략적인 분야까지 모두 포괄하고 있음을 보여줍니다.
교육과 연구 분야는 베이지안 통계, 데이터 마이닝, 몬테카를로 방법, 생존분석 등을 포함해 의학통계학, 함수적 데이터분석, 보험통계학 등 특화된 분야까지 아우르고 있으며, 4차 산업혁명의 주요 동력인 빅데이터와 인공지능 분야에서도 선도적인 연구를 진행함으로써 데이터 기반 의사결정을 가능하게 하는 현대 사회의 요구에 부응하고 있습니다.
응용통계학과의 교육 프로그램은 학생들이 졸업 후 금융, 반도체, 통신, 유통, 보험, 의학 등 다양한 분야에서 활동할 수 있도록 지원하고 있으며, 이는 학과가 졸업생들에게 제공하는 폭넓은 취업 기회를 반영합니다. 또한 경제학 및 경영학과 연계해 과목을 설계하고 다양한 진로에 필요한 능력 향상의 기회를 제공하고 있습니다.
학과 동창회에서는 대우관 리모델링을 비롯해 다양한 학과 발전기금을 후원하고 있으며, 학생들의 체육대회 및 수학여행을 지원하는 등 동문들의 활발한 참여와 후원이 이어지고 있습니다. 우리 대학교 내에서도 상경대학은 특히 강력한 동문 네트워크를 자랑합니다. 응용통계학과 졸업생들은 학계와 금융, 회계법인, 신용평가사, 공공기관, 반도체, 정보통신, 제약, 유통, 컨설팅 등 다양한 분야에서 맹활약 중입니다. 이러한 네트워크는 취업, 진학, 연구 협력, 정보 교류 등 여러 측면에서 학생 및 졸업생들에게 큰 도움을 주고 있습니다.
Q. 재학생 현황은 어떻게 되나요?주요 학과 행사 및 학생 활동을 소개해 주세요.
2024년 2학기 현재 300여 명의 학부생 및 130여 명의 대학원생이 재학 중입니다. 응용통계학과에서 개설한 교과목 평균 수강 인원은 2022년 70.2명, 2023년 76.4명, 2024년 59.7명으로 교내에서 가장 높은 수준을 유지하고 있습니다. 응용통계학은 여러 학문 분야에서 응용 및 확장할 수 있다는 장점이 있어서 타 학과 수강생도 상당히 많은 편입니다. 타 학과 학생들의 수강비율은 과목별 차이가 있긴 하지만 대부분 교과목 수강생 중 40~50%에 이릅니다.
우리 학과의 대표적인 학생 활동으로는 개강총회와 통계모임, 간식행사, 고대 통계학과와의 미니 정기전, 응통의 날, 통계데이터사이언스대학원과의 체육대회, 응통교재마켓, 전공과목 스터디, 복수전공 길라잡이 멘토멘티 매칭, 대동제 주점부스 운영, 총MT 등의 다양한 학생회 활동과 밴드 소모임 ‘스밴(SVAN)’, 배드민턴 소모임 ‘턴즈’, 축구 소모임 ‘CLT’, 낚시 소모임 ‘응에’, 스포츠 통계 학회 ‘YSAL’ 등이 운영되고 있습니다.
2023년부터 시작된 ‘(통)계모임’은 다양한 학번의 학생 4~5명이 한 조에 배정돼 만남을 가지는 활동으로 선후배들과의 친목 도모 및 관심사 교류를 증진하기 위해 매 학기 진행하고 있습니다. 정기 교류 중인 고려대학교 통계학과와는 1학기에는 대면식, 2학기에는 체육대회인 미니 정기전을 열어 매년 꾸준한 만남을 이어오고 있습니다. 또한 응용통계학과 학부생들과 통계데이터사이언스대학원생들의 교류 증진을 위해 연례 행사로 대운동장과 스포츠과학관에서 체육대회를 개최하고 있습니다.
응용통계학과 학우들의 아나바다 장터인 ‘응통교재마켓’은 전공 공부를 하며 공부한 책을 후배들에게 60% 이하의 저렴한 값에 넘기는 프로젝트로 선배가 후배를 챙기는 응용통계학과의 돈독한 정을 확인할 수 있습니다. 또한 학생들이 통계의 대가가 될 수 있도록 방학 기간 동안 전공과목 예복습 스터디를 진행하고 있고, 응용통계학과 본전공생들이 통계 활용의 도메인을 탐색할 수 있도록 복수 전공 학생들이 본인의 경험과 노하우를 전수하는 ‘복수전공 길라잡이 멘토멘티 매칭’ 사업을 추진하고 있습니다.
연세 스포츠 통계 학회 ‘YSAL (Yonsei Sports Analytics Lab)’은 스포츠 종목과 통계학에 대한 이해를 바탕으로 스포츠 데이터를 분석하는 역량을 기르고, 혁신적인 스포츠 통계 분석의 개발과 발전을 추구하는 학회입니다. 교내 및 프로 스포츠 구단과의 협업을 목표로 운영하고 있으며, 현재는 프로 농구단인 삼성 썬더스와 협업을 진행하고 있습니다.
이와 같은 다양한 학생활동을 통해 응용통계학과 학생들은 동기, 선후배 간의 우애와 친목을 다지고 학업 역량을 증진함으로써 사회 곳곳에서 필요로 하는 문제해결의 정확한 근거를 제시하는 전문 인력으로 성장하고 있습니다.
Q. 대학원 과정인 통계데이터사이언스학과는 학부와 학과명이 다른데 이유가 있나요?
통계데이터사이언스학과는 2020년 데이터사이언스 교육을 강화하기 위해 대학원 학과명을 기존의 응용통계학과에서 변경했습니다. 학과명 변경 이후, 데이터사이언스 관련 세부 과목을 다수 신설해 교육 과정을 보강했으며, 석사과정의 경우 통계학과 데이터사이언스학으로 세부전공을 구분해 학생을 선발하고 있습니다. 2024년 2학기 현재 통계데이터사이언스학과에는 박사과정 14명, 통합과정 27명, 석사과정 96명의 학생이 재학 중입니다.
통계데이터사이언스학과는 국내 통계학과 중 유일하게 대규모 BK21사업단을 운영 중입니다. 2020년 9월부터 ‘빅데이터 기반 융복합 데이터 사이언스 교육 및 연구’ 사업을 통해 데이터 과학 분야의 혁신적 교육을 선도하고 있습니다. 학과 대부분의 교수님들이 참여하고 있는 이 사업은 대학원생들에게 장학금과 연구 지원을 제공해 세계적 수준의 연구 인재를 양성하는 데 기여하고 있으며, 국제 협력을 바탕으로 데이터 과학의 새로운 패러다임을 제시하고 있습니다. 특히, 2024년 BK21 혁신인재사업 성과평가에서 우수 교육연구단으로 선정돼 그 역량을 인정받았습니다.
응용통계학과는 통계학과 데이터사이언스의 성공적인 융합을 통해 새로운 가치를 창출하며 학문적 경계를 넓혀가고 있습니다. 이러한 노력은 국내외에서의 학문적 인정뿐만 아니라, 실질적인 사회적 기여를 통해 지속적으로 그 의의를 확장시켜 나가고 있습니다.
“응용통계학과의 교육을 통해 빅데이터 시대에 필수적인 데이터 문해력을 갖추고,
이를 바탕으로 방대한 데이터 속에서 정확한 시그널을 찾아내기를 기대합니다.”
강상욱 교수 / 학과장
“저는 시간 또는 공간 상관관계가 있는 데이터에 대한 연구를 진행하고 있습니다.
데이터를 설명하는 새로운 모형과 알고리즘 개발이 주 연구분야입니다.”
박재우 교수
“데이터는 일상생활 전반에서 끊임없이 생성되고 축적되지만, 이를 바탕으로 올바른 의사결정을 내리기 위해서는
데이터를 탐색하고 분석해 인사이트를 도출하는 것이 필수적입니다.
응용통계학과는 이러한 데이터 기반 의사결정을 가능하게 하는 곳입니다.”
박태영 교수
“정보이론과 기계학습을 연구하며 관련 분야에서 차세대 인재를 육성하고 있습니다.
탄탄한 수학 이론을 기반으로 세상에 도움이 되는 데이터 과학 기술을 고안하는 것을 목표로 합니다.”
손지용 교수
“응용통계학과 및 통계데이터사이언스학과는 이론적으로 보장되며,
실험적으로도 뛰어난 성능을 자랑하는 신뢰성 높은 AI 알고리즘 개발에 앞장서고 있습니다.”
송경우 교수
“응용통계학과 및 통계데이터사이언스학과는 통계적 사고와 데이터 분석을 통해 복잡한 문제를 해결하는 능력을 기르는 곳입니다.
다양한 분야에서 데이터를 활용해 실질적인 변화를 이끌어낼 수 있는 전문가로 성장할 수 있습니다.”
이지현 교수
“응용통계학과의 커리큘럼을 통해 학생들이 통계적 방법론의 근본원리에 대해 깊이 이해하고
다양한 모델을 구현하고 적용할 수 있을 뿐 아니라, 데이터 엔지니어링, 문제 해결 능력 등
데이터사이언스 전반의 역량을 배양할 수 있기를 바랍니다.”
전용호 교수