浮 - 채마밭/3040 해외 이코노미스트

④ 김규일 미시간대 교수

浮萍草 2016. 1. 22. 10:03
    "빅데이터 경제학 시대 온다"
    
    “경제적인 분석을 하기 위한 모델을 만들 때 개별 경제 주체의 다양성을 최대한 반영해야 한다. 
    사람은 다 다르지 않은가.”
    “트윗 한 줄도 모두 중요한 데이터다. 
    기업은 물론 정치 분야에서도 빅데이터가 매우 중요한 시대가 왔다. 
    경제 분석에도 빅데이터를 활용하는 시대가 열리고 있다. ”
    김규일 미시간주립대 교수는 지난 4일(현지시각) 미국 샌프란시스코에서 열린 전미경제학회 현장에서 기자와 만나“전통 경제학과 다른 기법으로 경제 현상을 설명
    하는 시도가 최근 활발하다”면서 이렇게 말했다.
    서울대 경제학과 93학번인 김 교수는 로스앤젤레스 캘리포니아대(UCLA)에서 박사학위를 받고 현재 미국 미시간주립대 경제학과 교수로 재직 중이다. 
    과거 싱가포르 경영대와 미네소타대, 성균관대에서도 교수 생활을 했다. 
    세계 최대 인터넷 서점이자 온라인 쇼핑몰인 아마존닷컴에서 근무한 특이한 이력도 있다.
    김규일 미시간주립대 교수가 지난 4일(현지시각) 미국 전미경제학회 현장에서 빅데이터를 경제학 모델에 활용하는 최근 연구 등에 대해 이야기하고 있다.
    /온혜선 기자

    줄무늬 남방에 짙은 청색 재킷을 입고 나온 김 교수는 무언가를 설명할 때 쉬운 예를 들며 이해시키는 재주가 남달랐다. '실증적 산업조직론'이라는 다소 생소한 분야를 개척하는 중이라고 했는데 이야기를 들어보니 전통 경제학과는 다른 시도를 많이 하고 있었다. 계량경제학으로 박사학위를 준비하던 김 교수는 미시경제학 공부를 하던 중 둘을 접목시키면 재미있겠다고 생각해 당시 연구하는 사람이 많지 않던 실증적 산업 조직론에 뛰어들었다. 김 교수는 영어를 잘 못해 취업할 때 어려움을 겪었다고도 했고, 세 아이의 아빠라고 소개했다. 다음은 김 교수와의 일문일답. - 주로 연구하는 분야는 무엇인가. “계량경제학(Econometrics)과 실증적 산업조직론(Empirical Industrial Organization)이다. 기존 산업조직론은 모델을 만들어 기업과 소비자의 행동을 이해하고 예측하는 학문이었다. 실증적 산업조직론은 실제로 여러 데이터를 활용해 소비자,기업 및 각 경제주체들의 행동을 분석하고 평가 및 대안을 제시하는 것이다. 공정거래와 관련한 예를 하나 들어보겠다. 두 기업이 합병을 해서 독점력을 높였을 때 그 자체가 좋다거나 나쁘다는 판단을 하려면 소비자의 반응을 봐야 한다. 비슷한 제품을 내놓는 두 기업이 합병해서 더 좋은 제품을 낸다면 소비자 후생은 좋아진다. 중복되던 연구개발비 지출이 줄며 같은 값에 더 좋은 제품을 내놓을 수도 있지 않은가. 이런 경우는 독점이 돼도 나쁜 합병이라고 할 수 없다. 둘이 합병한 결과 품질은 그대로이면서 가격만 오른다면 소비자 후생은 나빠진다. 이것은 나쁜 합병이다. 물론 이런 것을 판단할 때는 여러 가지를 고려해야 한다. 예를 들어 가격탄력성에 따라 소비자의 반응이 달라질 수도 있다. 가격탄력성이 높은 경우에는 소비자가 오른 가격에 적극적으로 반응할 테니(물건을 사지 않을 테니) 큰 문제가 없을 수도 있다. 하지만 시리얼처럼 가격탄력성이 낮은 제품은 값이 올라도 사야 하니 소비자 후생이 나빠질 것이다. 제품도 기존보다 더 세분해서 봐야 한다. 같은 상품군에서도 가격에 따라 반응이 달라질 수 있다. 예를 들어 같은 브랜드의 자동차라도 럭셔리차 라인과 일반차 라인의 반응은 다를 것이다. 실제 소비자가 어떻게 반응하는지를 데이터를 바탕으로 알지 못하면 독점 기업이 생겼을 때 득이 되는지 아닌지를 판단하기가 어렵다.” - 연구 대상이 기업과 소비자에 한정된 것인가. “아니다. 정부도 정책의 소비자인 국민의 반응을 알아야 전체 후생을 높일 수 있다. 예를 들어 미국 펜실베이니아는 주류 판매를 정부가 관리한다. 수년 전까지 이곳에서는 일요일에 술을 팔지 않았다. 하지만 규제를 풀며 점차 일요일에도 팔도록 했다. 이런 결정을 할 때 정부는 여러 가지를 봐야 한다. 먼저 주류가게 입장에서는 일하지 않던 주말에 일을 하게 되면서 비용 증가 요인이 생겼다. 그런데 술이 더 많이 팔린다면 받아들일 수 있을 것이다. 반면 주말 손님이 늘어난 대신 주중에 오던 손님이 줄어 결국 판매량이 같다면 이득은 없고 손실만 있는 거다. 일요일에 문을 열어 새로운 소비자가 생기면 소비자의 후생도 늘고 주류가게 이익도 는다. 이런 경우에는 영업시간 규제를 없애는 정책이 좋은 정책인 것이다.” - 지도교수는 누구인가. 영향을 준 경제학자가 있다면. “박사과정 지도교수는 UCLA의 한진용 교수다. 미국 계량경제학계에서 영향력 있는 교수 중 한 분이다. 한 교수님은 학생들 사이에서 엄하기로 유명했다. 자신이 천재이시다 보니 학생들에게 요구하는 기준이 워낙 높았다. 이런 부분은 내가 학자로 성장하는 데 큰 도움이 됐고 학자로서의 삶에 지침도 되고 있다. 내 학생들에게도 전수하고 싶다. 빼놓을 수 없는 또 한 분은 미네소타대에서 함께 연구했던 패트릭 바야리(Patrick Bajari) 교수다. 나를 미네소타대로 이끌어준 분이기도 하다. 바야리 교수를 처음 만난 것은 박사과정 시절 세미나에서였다. 실증적 산업분석론의 몇 안 되는 연구자였던 바야리 교수가 내 박사논문에 큰 관심을 가졌다. 나는 박사학위를 받고 미국의 여러 좋은 학교 교수직에 지원했지만 실패했다. 영어에 익숙하지 않은 탓이었다. 그래서 싱가포르 경영대에서 교수 생활을 시작했는데 두 달 뒤 바야리 교수에게 연락이 왔다. 미네소타에서 함께 일해보자는 것이었다. 그가 미네소타대 정교수로 부임하면서 나를 조교수로 임용해달라는 요청을 했다는 것을 나중에 들었다. 바야리 교수와 3년 정도 함께 일하면서 많은 것을 배웠다. 바야리 교수는 나중에 아마존닷컴의 수석 이코노미스트 겸 부사장으로 이직했다. 1년 후인 2012년 나도 바야리 교수의 요청으로 아마존에서 잠시 일을 했다. 아마존에서의 일이 재미있긴 했는데 학문을 하는 것이 더 좋아서 6개월 만에 학교로 돌아왔다.” - 아마존닷컴에서는 어떤 일을 했나. “아마존이 오더블(audible) 닷컴이라는 회사를 인수하는 시점이었다. 오더블닷컴은 오디오북 제작회사다. 전자책과 오디오북을 합해 동기화하면 소비자가 매우 편리하게 쓸 수 있다. 전자책을 읽다가 덮고 운전하며 오디오북을 들을 수 있는 것이다. 오더블닷컴의 오디오북은 아마존의 전자책보다 몇 배 비쌌다. 물론 대중적인 제품이 아니니 많이 팔리지도 않았다. 얼리어답터 정도가 사서 쓰던 상황이다. 아마존은 오더블닷컴을 인수하고 제품값을 내리기로 했다. 이럴 때 기업 입장에서는 근거가 필요하다. 가격에 따른 수요 예측을 해서 얼마까지 값을 낮춰야 하는지를 찾았다. 예를 들어 15달러짜리 제품을 3달러로 낮춘 경우도 있다. 가격을 더 낮출 수도 있고 덜 낮출 수도 있는데 어느 지점에서 고객이 가장 많이 늘고 이익이 생기는지 최적의 지점을 찾아내는 것이다. 아마존은 성공적으로 제품군을 넓히면서 다양한 고객을 확보했다.”
    - 그동안 쓴 논문 중 가장 많이 인용된 논문은 무엇인가. “2012년 아메리칸 이코노믹 리뷰(American Economic Review)에 게재된‘합리적 기대 가설 접근법에 따른 소비자 만족 가격 지수의 추정: 대기오염의 평가비용’ 논문이다. 소비자 만족 가격지수(hedonic pricing) 추정 분야에 중요한 기여를 했다. 소비자 만족 가격지수는 통계 모형을 이용해 소비자들이 제품의 다양한 특성을 어떻게 평가하는지 확인하는 기법이다. 나는 논문에서 가격지수를 평가할 때 상품의 평가 요소 중 관측되지 않는 변수가 있으면 가격지수 평가에는 상당한 오류가 생긴다는 것을 제시했다. 사실 거의 모든 연구에 관측되지 않는 변수가 존재한다. 이런 관측되지 않은 변수가 시간에 따라 변동할 경우 문제는 더 심각해진다는 결과도 얻었다. 합리적 기대 가설을 바탕으로 이런 관측되지 않는 변수의 기간 변동을 모형화해 해결하려는 시도를 한 것이다. 구체적으로 샌프란시스코와 나파 밸리 등 캘리포니아 베이 지역의 1990~2006년 주택 가격을 바탕으로 주택 구매자들이 대기 오염도를 어떻게 평가하는지를 분석했다. 기본 아이디어는 주택 구매자들이 주택을 구매할 때 대기 오염도가 적은 지역을 선호하기 때문에 더 높은 가격을 지불할 용의가 있다는 것이다. 두 지역에서 비슷한 크기 주택의 가격 차이를 통해 주택구매자들의 공기오염에 대한 평가비용을 추정했다. 예를 들어 오존량에 대한 구매자의 평가비용은 1ppb당 170달러였고, 이산화황의 평가비용은 1ppb당 140달러 정도였다. 상당한 금액이다.” - 최근 연구 중 소개할 만한 것은 어떤 것이 있나.
    “계량경제학 저널(Journal of Econometrics)에 게재 예정인‘자본 추계의 오류를 허용한 생산함수의 추정’ 논문이 있다. 기존 연구들이 생산함수를 추정할 때 자본 추계의 오류를 고려하지 않는 점을 지적하고,자본 추계에 오류가 있는 경우 기존 생산함수 추정치,예를 들어 자본계수나 노동계수, 생산성지수 등에 문제가 있을 수 있음을 지적했다. 연구 결과 실제로 자본을 추계할 때 기업에 투자를 얼마나 했는지를 설문하는 방식을 주로 쓰는 데다 기존 자본에 대한 감가상각 정보도 정확지 않아 오류가 자주 발생할 수 있는 것으로 나왔다. 이 연구에서 나는 자본 추계 오류를 구체적인 계량 모델로 분석해 자본 추계에서 이를 보정하고 좀 더 정확한 생산함수 추정을 제시했다. 생산함수는 기업과 해당 산업의 생산성을 평가할 때 중요한 만큼 정확한 생산함수를 추정하는 것은 꼭 필요하다.” - 경제주체의 다양성 및 특이성을 계량경제학에 유연하게 적용하는 것이 과제라고 말했다. 어떤 의미인가. “다양한 경제주체 중에서 나는 주로 소비자를 연구한다. 디지털 일안반사식 카메라(DSLR)를 사려는 소비자를 예로 들어보자. 소비자의 유형이 하나라고 본다면 소비자는 싸고 품질 좋은 것을 원한다고 생각할 것이다. 하지만 소비자의 유형은 매우 다양하다. 가격 대비 성능을 따지는 소비자도 있을 것이고 성능에 중점을 둔 소비자도 있을 것이다. 성능에 중점을 둔 소비자는 값을 더 지불하더라도 좋은 것이 나오면 살 것이다. 이런 것을 정확히 알려면 소비 분석을 해야 한다. 소비자의 분포를 잘 보자는 것이다. 기존 연구는 소비자의 반응을 가격탄력성 같은 하나의 값으로 본다. 분포를 보면 소비자의 개별 특이성이나 다양성을 알 수 있다. 또 실제 현실이 그렇지 않은가. 항공사 고객 중 레저를 위한 여행객과 비즈니스를 위한 여행객의 선호는 다를 수밖에 없다. 이런 면에서 개별 경제 주체의 다양성을 적용하는 경제 모델을 만드는 것이 과제다.” - 실제 연구한 사례를 들어준다면. “온라인 리뷰에 개별 소비자가 어떻게 반응하는가를 연구한 적이 있다. 일반적으로 리뷰가 좋을수록 제품이 잘 팔릴 거라고 생각할 것이다. 하지만 이건 소비자가 한 종류일 때 가능한 얘기다. 어떤 소비자는 리뷰가 나빠도 싼값이 맘에 들어 제품을 살 수 있다. DSLR이 주머니에 쏙 들어간다면 사진의 품질이 덜 좋아도 괜찮다는 소비자도 있을 수 있다. 이런 것을 모델(계량모형)로 만들려면 개별 소비자가 다른 행동을 할 수 있다는 것을 허용해야 한다. 그렇지 않으면 실제 데이터로 실증분석을 해도 잘못된 결과가 나올 수 있다. 모델을 유연하게 만드는 것이 필요하다는 의미다. 기업 입장에서도 소비자의 반응을 제대로 아는 것은 매우 중요하다. ” - 요즘 관심을 갖는 분야가 있다면. “빅데이터를 활용한 수요분석이다. 카메라의 수요분석을 세분화할 수 있다. 카메라의 사양만 해도 픽셀이나 화면 사이즈,화질,플래시 등 여러 수치가 있다. 여기에 소비자가 중요하게 생각하는 것들은 사소한 것일지라도 의미가 있을 수 있다. 색상이나 디자인 등 수치가 아닌 설명에 해당하는 것들이다. 빅데이터를 활용하면 이런 문구들을 바탕으로 수요분석을 할 수 있다. 요즘 미국에서는 기업뿐만 아니라 학교, 연방준비제도이사회에서도 빅데이터에 관심이 많다. 작년 말에 캔사스 연방은행의 빅데이터 워크숍에 초대되어 내 연구를 발표하기도 했다. 은행에서 어떤 고객에게 돈을 빌려줬는지 그들 중 누가 파산했는지를 본다고 가정해보자. 기존에는 소득과 성별, 직업, 나이를 변수로 분석했을 것이다. 하지만 빅데이터를 활용하면 고객이 작성한 대출신청서 한줄 한줄이 전부 변수가 될 수 있다. 내가 속한 미시간 주립대에도 최근 빅데이터 분석 센터가 생겼고 현재 해당 센터의 자문위원을 맡고 있다. 경제학뿐만 아니라 심리학과 정치학에서도 요즘 빅데이터를 많이 이용한다. 센터는 별도의 교수와 박사후 과정을 채용할 계획도 갖고 있다. 새로운 데이터를 생성해야 하기 때문이다. 트위터의 상품 리뷰, 아마존닷컴의 리뷰 등 가능한 모든 리뷰 사이트에서 특정 제품의 리뷰를 다 잡아내 분류한다면 엄청난 양의 데이터가 생기지 않겠는가.” - 두루뭉술한 말로 된 리뷰를 어떻게 데이터로 쓰나. “별 다섯개로 점수화한 리뷰도 사실 정확한 것은 아니다. 받아들이기에 따라 다 다르다. 모든 소비가 5점 만점에 3점을 준 제품이 있다고 가정하자. 대부분 사람에게 이런 제품은 매력이 없다. 하지만 어떤 사람은 5점, 어떤 사람은 1점을 줘서 평균 점수가 3점이 된 제품이라면 5점을 준 사람과 비슷한 사람에게는 좋은 제품일 수 있다. 분포를 봐도 되겠지만 더 잘 보려면 소비자의 워딩을 보는 방법을 써야 한다. 좋은 말과 중립적인 말과 나쁜 말이 있을 테니 전체 워딩이 변수가 되는 것이다. 이렇게 하면 무진장 많은 변수가 생긴다. 여기서 중요한 몇 가지를 골라내는 데 계량경제학이 역할을 하는 것이다. 데이터와 기법, 컴퓨터를 이용해서 말이다. 1970년대와 비교하면 지금의 자동차는 매우 비싸다. 하지만 그만큼 여러 기능이 들어갔고 품질이 좋아졌다. 그렇다면 소비자의 후생은 증가했을 수도 있다. 품질은 데이터가 아니니 계량경제학이 이것을 데이터 영역으로 가져오는 것이다. 최근 많은 경영대학원에도 빅데이터 센터가 생기고 있다.” - 이 분야는 얼마나 발전해 있나. “사실 빅데이터로 수요 분석을 하는 분야가 아직 학계에서 주류가 아니다. 경제학 톱5 저널에 이 분야 논문이 실린 적도 없다. 아마 한 번 실리고 나면 여러 사람이 연구에 몰려들 것이다. 아직 전통적인 경제학과 교집합이 많지 않다. 전통경제학과 비교를 해보자. 아마존,넷플릭스 등에 개별 소비자가 로그인했을 때 어떤 화면이 뜨는가는 매우 중요하다. 전통적인 경제학이나 계량경제학에서는 소득과 나이, 혼인 여부 등을 바탕으로 첫 화면을 고를 것이다. 빅데이터를 이용하면 이렇게 될 것이다. 과거 6개월의 행동을 보면 모든 게 나올 것이다. 이 소비자는 2주마다 기저귀를 사더라. 하면 2주가 되는 날 알람을 보낼 수 있다. 또 이 물건을 샀을 때 추가로 살 만한 것도 보여줄 수 있다. 빅데이터 기반으로 찾아낸 것들로 말이다. 클릭 행동만 봐도 다음 행동을 예측하는 것이다. 아마존과 넷플릭스는 이미 이렇게 하고 있다. 과거 구매 행태 등을 보고 미래 구매 행태를 예측하는 것이다. '이런 것이 기존 경제학과 맞지 않다''큰 의미도 없다''그래서 어쩌자는 건데?''그게 무슨 의미가 있지?'라고 할지도 모른다. 경제학에는 기본적으로 '왜 하느냐'는 연구 질문이 있어야 하기 때문이다. 하지만 기업에는 이런 것이 필요하다. 이익을 극대화하는 데 도움이 된다.” - 앞으로 어떤 연구를 할 것인가. “나는 계량경제학을 하는 사람이니 실증연구를 하는 사람들이 쓸 수 있을만한 모델을 만들고 솔루션을 개발하는 것에 중점을 둘 것이다. 요즘 워낙 응용경제학을 많이 하는 추세이지 않은가. 중국만 봐도 소비자가 얼마나 많은가. 광고나 제품을 잘 추천하려면 소비자를 이해해야 한다. 가장 어려운 것은 실제 데이터를 어떻게 얻을까 하는 것일 거다. 그래서 데이터 사이언스를 하는 공학자나 컴퓨터 공학자 등이 이 분야에 더 많이 들어와야 한다. 요즘은 정치학에서도 빅데이터를 많이 활용한다. 후보자에 대한 선호는 정치라는 제품에 대한 소비자 행동이다. 민주당이든 공화당이든 정책을 내면 소비자 반응이 있을 것 아닌가. 트위터 등에서 각각의 키워드가 얼마나 임팩트 있었는지를 알아볼 수 있다.”
      샌프란시스코=온혜선 조선Biz 기자 onlyyou@chosunbiz.com

    草 浮
    印 萍