잡식성 논문 읽기/Frontiers

선하증권(BoL) 데이터의 국제무역연구에서의 활용

choijeo86 2022. 1. 20. 15:32

이건 리서치비틀에 적기에는 대중적으로는 크게 재미없을 것 같은 이야기라 여기서만 정리. 근데 딴 건 대중적으로 재미가 있나...?

 

- 다른 분야와 비슷하게 국제무역 또한 데이터의 발전, 그리고 그 데이터들에서 발견되는 현상을 설명하는 이론들의 등장과 함께 연구 흐름이 이어져 왔음. 

20세기 중후반에는 산업단위 데이터의 분석과 Krugman의 새무역이론이 큰 흐름이었다면, 21세기 초 다양한 종류의 기업 단위 데이터들이 나오면서 Melitz의 기업 이질성에 초점을 맞춘 무역 이론이 등장하였고, 이후 다시 더 세분화 된 공장 단위 데이터들이 등장하였음. 

 

- 한국의 경우 기업단위 데이터는 통계청의 기업활동조사(SBA), 그리고 NICE의 키스밸류(KisValue), 한국기업데이터(KED) 등이 있으며 각각의 장단점들이 있음. 이들 데이터가 축적되면서 21세기 초반 한국의 무역이 기업활동에 미치는 영향들에 대해서도 어느 정도 연구 성과들이 축적되었음. (기업활동조사의 경우 2006년부터 조사가 이뤄졌는데 타국의 기업데이터들과 비교해 여러 장점이 많은, 좋은 데이터라고 생각함.) 공장단위데이터는 전국사업체조사가 있음. 

 

- 그밖에 최근 들어서는 종전의 데이터들이 제한적인 정보만을 담았다면 보다 넓은 범위의, 자세한 정보들을 담은 대신 물리적으로 제한된 조건에서만 연구자에게 공개하는 RDC 데이터들도 많이 등장하였음. 

 

- 지금은 빅데이터와 인공지능의 시대. 국제무역에서도 아주 최근 들어 조금씩 이용되고 있는 연구 데이터들 중 하나가 이전에 언급한 선하증권(Bill of Lading, 이하 BoL) 데이터임. BoL데이터를 국제무역 연구에서 사용하는 것은 아직 시작 단계인데, Aaron Flaaen과 여러 동료 연구자들이 작년 말에 자신들이 가진 미국의 BoL 데이터를 통해, 이러한 데이터를 국제무역 연구에 사용하는데 있어서 어떤 장점과 단점이 있을 수 있는지 정리하였음(Link). 이를 여기 적어 둠. 참고로 선하증권이란 어떤 물건을 선적하면서 이에 대한 다양한 정보들을 적은 유가증권 서류임. 

 

장점

 

- 1. 고빈도(High Frequency)!

현존하는 무역 데이터들 중 거의 유일하게 '하루' 단위로 데이터가 정리되어 있음. UN Comtrade나 WITS, 그 밖에 다른 정부기관들이 발표하는 무역 데이터는 대부분 '월'단위로 정보를 제공한다는 점에서 훨씬 세부적인 분석이 가능해짐. 

 

이러한 고빈도의 장점을 이용해 가장 쉽게 생각할 수 있는 분석이 코로나19 팬데믹 및 대응에 따른 국제무역의 변화임. 다음 그림은 인도에서의 2020년 3월 사회적 봉쇄(Lockdown) 조치 이후 미국-인도간 교역의 추세를 BoL데이터로 그린 것임. 

 

 

- 2. 정보의 자세함(Detailedness)!

자세한 수준에서 기업(송하인 Shipper/수취인 Consignee)-상품 품목-출발국-도착국 수준의 정보를 담은 데이터는 매우 드묾. 그리고 그 밖에 운송수단 및 그 수단들에 대한 정보(예컨대 배 이름, 항공기 노선 등 ), 출발지 및 도착지 (항구 및 공항), 거래조건, 결제조건 등에 대한 정보들도 제공되므로 이들을 활용해 종전해는 분석하지 못했던 연구주제에 대한 접근이 가능함. 

BoL데이터를 제외하고는 각국의 관세청이 제공하는 데이터들도 이런 정보들을 제공하는 것들이 있으나 연구목적의 이용에 물리적 제약(i.e. 외부와 차단된 데이터센터에서만 접근 가능)이 많음. BoL 데이터는 일단 데이터가 확보되면 다른 공개데이터와 같이 그런 제약은 없다는 것도 장점.  

 

- 3. 적시성(Timeliness)!

정부들이 내놓는 공식 데이터들보다 빨리 데이터가 나오기 때문에 현안들에 대해 더 빠른 분석이 가능함.   

 

- 4. 다른 데이터와의 연결성(Connection)!

송하인/수취인 정보를 이용해 다른 기업, 공장 단위 데이터와 연결하거나, 국가 단위에서의 다른 데이터 등과의 연결등을 통해 글로벌 공급망 등에 대한 다양한 분석이 가능함.

(다만 실제로 데이터를 까보면 역시 다른 데이터와 잘 연결하려면 상당한 품이 들어갈 것이라는 것을 알 수 있음. 어느 데이터가 안그렇겠냐만...)

 

단점

 

- 1. 해상 운송(maritime transport)이 아닌 경우에 대한 정보의 부재

예컨대 미국의 경우 캐나다/멕시코와는 육로를 통한 교역이 상당한데 이 부분에 대한 정보가 없을 수 있음

 

- 2. 빠진 관측치의 문제

일부 경우 기업 측면에서 관세당국에 요청해 송하인/수취인 정보를 삭제하는 경우가 있음. 

 

- 3. 그 밖에 상품 가치 및 품목 코드 정보들에서 생길 수 있는 문제점도 지적되어 있음. 

 

- 4. 연구자들이 언급하지는 않았지만, 역시 의미 있는 정보를 뽑아내려면 (오타, 표기 방식의 차이 및 변화 등을 고쳐주는) 노가다가 들어감. 근데 이건 BoL 데이터뿐 아니라 많은 대용량 데이터들이 가진 문제이니...

 

그럼에도 불구하고 우리 연구 맥락에서는 데이터의 장점은 꽤 크고 단점은 크지 않은 것 같음.

베트남의 BoL 데이터를 보면 이 데이터에서 보여주는 수출입 추세와 베트남 통계청(Link)이 내놓는 공식 월별 수출입 추세가 거의 흡사하다는 점을 통해 BoL데이터가 베트남의 대외 교역 전체를 상당히 잘 커버한다는 것을 알 수 있음. 따라서 베트남의 경우 (Flaaen 등이 미국의 경우를 통해 언급한) 위의 단점이 큰 문제가 아닌 것으로 보임. 

 

PS. 베트남 BoL데이터에 대해서는 다음 보고서 3장을 참조 Link

 

PS2. 재밌는 것은 베트남 BoL 데이터에는 국가 내 교역(즉 발송국과 수취국이 모두 베트남)에 대한 정보도 상당히 포함되어 있는데 이부분은 이부분대로 또 파보면 재밌는 이야기들이 있을 것 같음.