Journal of Channel and Retailing
Korea Distribution Association
Research article

소셜 빅데이터를 활용한 전통시장 활성화 방안 연구*

정해운1, 이성호2,*
Hae Woon Jeong1, Seong Ho Lee2,*
1국립한밭대학교 창업경영대학원 석사(jhw2713@naver.com)
2국립한밭대학교 융합경영학과 부교수(lsh33@hanbat.ac.kr)
1Master, Graduate School of Entrepreneurial Management, Hanbat National University
2Associate Professor, Dept. of Business Administration, Hanbat National University
*Corresponding Author: lsh33@hanbat.ac.kr

© Copyright 2024 Korea Distribution Association. This is an Open-Access article distributed under the terms of the Creative Commons Attribution NonCommercial-ShareAlike License (http://creativecommons.org/licenses/by-nc-sa/4.0) which permits unrestricted non-commercial use, distribution, and reproduction in any medium, provided the original work is properly cited.

Received: Dec 13, 2023; Revised: Jan 04, 2024; Accepted: Jan 05, 2024

Published Online: Jan 31, 2024

국문초록

본 연구에서는 소셜 빅데이터 분석을 통해 전통시장 활성화에 대한 핵심적인 요인을 도출하였다. 전통시장을 직접 이용하는 소비자의 반응을 통하여 전통시장 활성화에 대한 핵심 요인을 도출하기 위해 전통시장 활성화와 관련된 뉴스 기사의 댓글을 활용하였다. 데이터 수집의 범위는 20년도부터 23년도 7월까지를 선정하였고, 데이터 수집을 위해 파이썬을 활용한 크롤링 기술을 통해 전통시장 활성화에 대한 뉴스 기사의 댓글을 데이터로 수집하였다. 수집된 데이터를 정제하여 키워드 빈도 분석, 네트워크 분석, 토픽 모델링 분석(LDA)을 실시하였다. 그 결과 첫 번째로, 전통시장 활성화와 관련되어 가장 대두되는 주제는 대형마트와의 상생 및 경쟁으로 나타났다. 이는 대형마트와 온라인 쇼핑과 비교되어 상대적으로 전통시장의 장점이 부각되지 못하고 있음을 나타내고 있고, 이를 극복할 수 있는 경영 및 마케팅 전략이 필요할 것으로 보인다. 또한 주차, 카드 사용 등 시설 및 경영 환경과 관련된 주제가 상대적으로 높게 나타났는데, 이는 현재까지 전통시장 활성화 지원 정책으로 많은 지원이 있음에도 시설 및 경영 환경 부분에서 더 많은 개선이 필요하다는 점을 시사하고 있다. 마지막으로는, 2023년 예산시장과 같이 전통시장 활성화의 성공 사례를 본보기로 삼아 지자체와의 협업, 기업의 투자 유치, 주변 상권과의 교류 등의 방법을 활용하여 전통시장 고유의 특성을 살려 경쟁력을 강화해야 함을 시사하고 있다. 본 연구는 이러한 결론을 통해 쇠퇴해가고 있는 전통시장의 활성화를 통해 전통시장과 더 나아가 지자체에 활력을 불어 넣을 수 있는 지원 정책을 수립하는 데 시사점을 제공하는 데 의의가 있다.

ABSTRACT

In this study, we derived key factors for revitalizing traditional markets through the analysis of social big data. To identify the core factors for revitalizing traditional markets, we utilized comments on news articles related to the revitalization of traditional markets, which were expressed by consumers who directly use traditional markets. The data collection period was selected from 2020 to July 2023, and we collected comments on news articles related to the revitalization of traditional markets as data using web scraping techniques with Python. The collected data was refined and analyzed through keyword frequency analysis, network analysis, and topic modeling analysis (LDA).

As a result, the most prominent topic related to traditional market activation was the coexistence and competition with large-scale supermarkets. This indicates that the advantages of traditional markets are not sufficiently highlighted compared to large-scale supermarkets and online shopping, emphasizing the need for management and marketing strategies that can overcome this challenge.

Additionally, topics related to facilities and management environment such as parking availability and card usage showed relatively high frequencies, suggesting that further improvements are needed in facility infrastructure despite existing support policies for traditional market activation.

Lastly, successful cases such as the 2023 Budget Market exemplify the importance of utilizing collaborative efforts with local governments, attracting corporate investments, and promoting exchanges with surrounding commercial areas in order to enhance the unique characteristics and competitiveness of traditional markets.

This study provides valuable insights for formulating support policies that can inject vitality into declining traditional markets while benefiting local governments.

Keywords: 전통시장; 빅데이터; 텍스트 마이닝; 소셜 네트워크 분석; 토픽모델링
Keywords: Traditional Market; Big Data; Text Mining; Social Network Analysis; Topic Modeling

Ⅰ. 서론

과거 우리나라 유통구조는 대기업을 중심으로 체계적으로 갖춰지고 고급화된 백화점(대형마트), 가계로부터 접근성 좋은 슈퍼마켓(구멍가게), 그리고 인정 넘치는 전통시장으로 구성되어 왔다. 이 중에서 전통시장은 상거래의 핵심이며, 서민들의 삶의 현장이자 만남과 소통의 장소 등 경제적, 사회문화적으로 다양한 역할을 맡아왔다. 하지만 지금의 전통시장을 살펴보면 전통시장의 제 기능을 다 하지 못하는 시장들의 수가 증가하고 있고, 또 전통시장을 떠나거나 다양한 문제로 힘겨워하는 상인 및 소상공인들이 증가하여 사회·경제적으로 심각한 문제가 되고 있다(장흥섭, 2010).

전통시장은 오래전부터 한국 문화와 경제, 사회적인 부분에서 중요한 요소로 여겨져 왔다. 그러나 최근 몇십 년 동안, 전통시장은 다양한 이유로 인해 경쟁력을 잃고 쇠퇴하고 있는 경향을 보이고 있다. 이에 따라 전통시장 활성화는 현대 시대에 꼭 필요한 시대적 과제로 부각되고 있다. 이러한 시대적 과제를 해결하기 위해 정부와 지자체는 끊임없이 전통시장을 활성화시키기 위한 정책 및 전략을 내세우며, 다방면에서 아낌없는 지원을 하고 있다. 하지만 이러한 투자 및 지원에도 불구하고 이러한 시장지원 자금의 활성화 효과에 대해 적지 않은 사람들이 의문시하고 있어 문제다. 전통시장 활성화를 위한 지원 자금(규모)에 비해 실제 전통시장의 활성화 정도가 미미하다고 판단하기 때문이다(장흥섭, 2018).

소비자는 전통시장에서 제공되는 제품과 서비스에 대해 강한 관심과 영향력을 가지고 있다. 그들의 구매 판단과 소비 행동은 전통시장의 성공과 실패에 직접적인 영향을 미칠 수 있다. 따라서 소비자들의 반응과 태도를 이해하고 분석하는 것은 전통시장 활성화를 위한 정책 및 전략 개발에 필수적이다. 이러한 맥락에서, 텍스트 마이닝 기법은 다량의 텍스트 데이터(비정형 데이터)를 분석하여 의미 있는 정보를 추출하는 데 유용하게 활용될 수 있다. 특히 뉴스 기사의 댓글 데이터는 소비자들의 다양한 의견과 태도를 직관적으로 포착할 수 있는 유용한 자료로 사용될 수 있다.

전통시장 활성화와 관련된 이전 선행연구들을 살펴보면 다양한 측면에서 전통시장 활성화를 위한 핵심 요인을 도출하거나, 전통시장 활성화 지원에 대한 타당성 분석 및 성과에 대한 영향 분석 등에 관한 연구들이 진행되고 있다. 하지만, 이러한 연구에서 도출된 여러 전통시장 활성화 방안과 지원이 지속적이며 효과적인 성과를 내는 데 한계가 있는 것으로 보인다. 이는 현재의 전통시장 활성화 방안 및 지원 정책만으로는 전통시장의 경쟁력을 강화하고 소비자들의 마음을 다른 유통 업태로부터 사로잡는 데 한계가 있음을 의미하며, 더 소비자들의 근본적인 문제와 필요를 파악하여 이를 해결할 수 있는 효율적인 전통시장 활성화 방안을 도출해야 함을 의미한다.

이를 위해 본 연구에서는 텍스트 마이닝 기법을 활용하여 전통시장 활성화와 관련된 네이버 뉴스 기사의 댓글 데이터를 수집 및 분석하고, 이를 바탕으로 전통시장 활성화에 대한 소비자들의 반응을 네트워크 분석 및 토픽 모델링 기법을 통해 올바른 전통시장 활성화 방안을 위한 핵심 요소를 도출해보고자 한다.

네트워크 분석은 개인, 그룹, 조직 간의 관계를 분석하는 방법론으로, 도출된 핵심 키워드들 간의 관계를 분석하여 소비자들의 관심사, 선호, 행동 패턴 등을 파악하고 이를 통해 전통시장 활성화 방안을 도출하는 데 효율적인 분석 방법론이다.

또한, 토픽 모델링 분석은 문서 내의 주제를 파악하는 방법론으로써, 소비자들이 어떤 주제에 대해서 언급하는지, 그 주제들이 어떻게 연결되어 있는지를 분석할 수 있다. 따라서 전통시장의 특성과 소비자들의 니즈를 파악하고 이에 맞는 올바른 전통시장 활성화 방안을 도출하는 데 적합한 방법론이다.

이러한 분석 방법들을 통해 전통시장 활성화 방안을 도출하는 데 그치지 않고, 도출된 전통시장 활성화 방안의 방향성과 정부 및 지자체의 전통시장 활성화 지원 정책과 비교하여 정책의 실효성을 파악하고자 한다. 이러한 방향성의 연구를 통해 결론을 도출하고 이를 바탕으로 전통시장 활성화에 보다 실효성 있는 정책 및 지원 방향을 제공하는 것에 목적이 있다.

Ⅱ. 이론적 배경

1. 전통시장 현황

전통시장이란 자연발생적으로 또는 사회적ㆍ경제적 필요에 의하여 조성되고, 상품이나 용역의 거래가 상호신뢰에 기초하여 주로 전통적 방식으로 이루어지는 장소를 말한다. 또한 통상적으로 지칭할 때, 해방 이전 물물교환의 장에서부터 근대화의 시점으로 보는 60년대 이후 개설되기 시작한 상설시장은 물론 자생적으로 형성된 노점상 위주의 저잣거리 등도 포함된다(송부용, 권성오, 2001).

이러한 전통시장은 지역주민들이 만나 소통하는 사회적 기능은 물론 지역 내 화합과 문화를 공유하는 장, 공동체 강화의 장 등의 역할을 해왔다(김종국, 2008). 그뿐만 아니라 상품 교환의 장소 이상의 역할, 즉 지역 풍물과 축제의 중심 무대의 역할도 한다. 요컨대 전통시장은 지역 고유의 전통문화와 정서가 담긴, 지역 특산물품 거래의 중심지로서, 약 35만 6천 명(2015년 기준)의 일자리를 제공하는 등 매우 중요한 역할을 하는 곳이다(조규호, 2014).

최근 몇 십년 동안 국내 전통시장의 수는 감소하는 추세를 보이고 있다. 다음 <그림 1>에서 보는 바와 같이 2022년 소상공인 시장공단의 전통시장·상점가 및 점포경영실태조사에 따르면 특히, 최근 10년의 국내 전통시장의 수를 살펴보면 `14년도에는 1,536개의 전통시장(등록시장 49.9%, 인정시장 41.1%, 무등록시장 9%)에서 `21년도에는 1,408개까지 감소하였다. 이러한 현상에는 다음과 같은 요인이 영향을 끼친다고 볼 수 있다.

jcr-29-1-121-g1
그림 1. 전통시장 수 추이
Download Original Figure

첫째로, 최근 도시화와 현대화로 인해 소비자의 생활 방식의 변화가 전통시장에 영향을 미치고 있는 것으로 판단된다. 도심지에서는 대형마트나 쇼핑몰, 백화점과 같은 현대적이고 고급스러운 유통 시설이 생겨나면서 소비자들은 편리성과 다양성을 더 선호하는 경향이 있다. 또한, 온라인 쇼핑에 대한 플랫폼의 발전 또한 중요한 역할을 하고 있다. 이에 따라 일부 소비자들은 결국 전통시장보다는 대형마트나 온라인 쇼핑 등을 더 선호할 것으로 판단된다.

둘째로, 경제적인 문제와 젊은 세대의 관심의 변화 또한 전통시장의 감소에 영향을 주었을 것으로 판단된다. 젊은 세대들은 고용의 기회와 소비 패턴이 빈번하게 변화함에 따라 전통시장에서 사업을 시작하기보다는 다른 분야나 모던한 형태의 사업을 더 선호하기 때문에 젊은 세대의 전통시장 입점을 꺼려하고 있다.

셋째로, 동네 상권의 변화와 도시 개발 정책도 전통시장 감소에 영향을 끼칠 것으로 판단된다. 동네 상권 개발 및 도시 재정비 정책으로 인해 일부 전통시장이 제 역할을 하지 못하고 철거되거나 본래의 성격과 다른 큰 변화를 겪고 이를 극복하지 못하는 경우도 있다.

하지만 그럼에도 불구하고 많은 지역 사회에서 여전히 활기찬 전통시장들은 존재하며, 일부 지역에서는 지속적인 보존 및 활성화를 위한 노력과 지원 또한 이루어지고 있다.

2. 전통시장 활성화를 위한 지원 정책

정부의 전통시장에 대한 활성화 지원 정책은 2002년 1월 시행된 ‘중소기업의 구조개선과 재래시장활성화를 위한 특별조치법’을 계기로 본격화되었다. 이 법에 의거하여 정부에서는 전통시장의 시설현대화 사업을 본격적으로 추진하기 시작하였다. 또한, 2005년 3월 ‘재래시장 육성을 위한 특별법’을 시행하여 전통시장의 환경개선 사업 및 경영혁신 사업을 시작하게 되는 계기가 되었다(박상훈, 이희정, 2016).

<표 1>과 같이 중소벤처기업부는 전통시장의 경쟁력 강화와 문제점 개선을 위해 크게 두 방향으로 전통시장을 지원하고 있다. 첫 번째는 청년몰 조성, 문화 관광형 전통시장 육성, 디지털 전통시장 육성, 지역상품 전시 등을 통해 경영 환경을 개선하고 경영 혁신을 지원하고 있다. 두 번째로는 노후 전선 및 시설 정비 지원, 화재 알림 시설 설치 지원, 주차 환경 개선 등을 통해 전통시장의 노후화된 환경과 시설에 대한 개선을 지원하고 있다.

표 1. 중소벤처기업부 전통시장 활성화 지원 정책
사업명 지원내용
경영 혁신 지원 • 지역상품 전시 지원
• 디지털 전통시장 육성
• 문화 관광형 전통시장 육성
• 시장 경영 패키지 지원
• 청년몰 조성 및 활성화 지원
• 첫 걸음 기반 조성 지원
환경 개선 지원 • 화재 알림 시설 설치 지원
• 노후전선 정비 지원
• 주차 환경 개선 지원
Download Excel Table

이러한 중소벤처기업부의 전통시장의 상점가 및 상점가 활성화 지원 사업은「소상공인 자생력 강화 대책」과 연계하여 전통시장·상점가의 자생력 및 경쟁력 확보를 위해 적극적으로 지원했다. 온라인 쇼핑 확대로 인한 전통시장의 고객감소를 극복하고자 역사·문화·관광 등 지역 고유 자원과 연계하는 특성화 시장 141곳(293억)을 육성하고, 전통시장 내 볼거리, 즐길거리 발굴을 통한 관광 상품 개발과 유명 인플루언서 등을 활용한 홍보 강화 등 전통시장·상점가 매출 기반을 다지기 위해 다양한 노력을 하고 있다. 또한, 전통시장 이용 고객들에게 편리한 쇼핑환경을 제공하기 위해 주차 환경 개선 96곳 등에 총 1,424억원을 전통시장 주차환경개선사업으로 지원하는 등 소비자들의 편의성을 높이기 위하여 많은 지원을 하고 있다(정영라, 2020).

Ⅲ. 선행연구 분석

1. 전통시장 활성화 관련 선행연구 분석

초기 전통시장 활성화 관련 연구들은 전통시장의 활성화 방안, 전통시장 지원에 따른 타당성, 전통시장 성과에 긍정적인 영향요소 파악, 전통시장의 침체 및 어려움과 관련된 연구들이 진행되고 있었으며, 특히 전통시장 활성화 관련 연구는 시장시설 현대화와 경영현대화의 두 분야를 중심으로 진행되고 있었다(고호석, 2019).

초기 전통시장 연구들은 주로 오프라인 전통시장의 시설 관련 연구들이 대부분이었다. 대표적으로, 김준식과 김종진(2012)의 연구에서 전통시장 활성화를 위해서는 온누리 상품권, 주차장의 확보, 셔틀버스 운행 및 대형마트 규제가 전통시장을 활성화하는데 도움을 준다고 주장하였고, 이준호 외(2013)는 시설현대화 사업 지원 이후 전통시장에 대한 실증분석을 통해 시설현대화 사업이 전통시장 활성화에 미치는 영향을 분석하였다. 또한, 최인혁과 김훈구(2017)는 전통시장의 이벤트 광장 조성 여부, 시장안내도 설치 여부, LED 광고판 대수, 조형물 수 등 물리적 환경이 전통시장 매출액에 영향을 미치는 것을 확인하였다.

그러나, 유통환경의 디지털 트랜스포메이션이 가속화됨에 따라 몇몇 연구에서는 디지털방식의 방안이 도입되어야 함을 주장하는 연구가 등장했다. 김승욱(2012)은 단순한 시설개선이나 주차 공간 확보만으로 전통시장 운영의 근본적인 문제를 해결할 수 없으며, 전통시장 활성화를 위해서는 SNS 공간 활용 등 소프트웨어 차원의 전략이 필요하다고 주장하였고, 이성호와 최진(2021)의 연구에서는 최근 전통시장에서도 온라인판매, 온라인 장보기, 라이브 커머스 등과 같은 새로운 형태의 판매방법의 접목에 관심이 있으며, 앞으로의 전통시장 활성화 연구는 전통시장에 새롭게 접목하고자 하는 새로운 형태의 판매활동 등을 고려한 특성화 방안을 적용하여 소매점 자산 및 이용의도와의 관계를 파악해보는 연구가 필요할 것이라 제안했다. 또한, 김제선(2021)은 코로나 19 확산과 최근 소비 트렌드에 맞추어 전통시장의 주체자들이 코로나 19 등에 대처하는 방안 중 하나로 라이브 커머스 등 새로운 비대면 소비형태가 전통시장 이용으로 연결될 수 있게 하는 것이 중요할 것이라 설명하였다.

최근 들어 전통시장분야에도 텍스트 마이닝을 이용하여 전통시장의 활성화에 대한 연구들이 이루어지고 있다. 대표적으로, 박상훈과 이희정(2018)의 연구에서는 SNS의 소셜 데이터를 활용해 서울 망원시장과 수유시장을 중심으로 활성화 요인을 도출하였다. 키워드 분석, 중심성 분석, CONCOR 분석을 통해 개별 시장만의 매력을 통해 대형마트가 줄 수 없는 문화·예술·관광의 가치를 전통시장의 강점으로 살리는 전략이 필요하다고 제안하였다. 또한, 김미향과 유재원(2021)의 연구에서는 소셜 빅데이터를 통해 전통시장의 동네시장 장보기 플랫폼 활성화를 위한 주요 요인들에 대한 탐색적 연구를 진행하였다.

본 연구에서도 최근 비정형 데이터를 정형화하고 분석하여 새로운 인사이트를 생성한다는 장점을 활용하기 위해 다양하게 이용되고 있는 텍스트마이닝 방법론을 이용하였다. 이를 통해 소비자들의 직접적인 반응과 표현을 통해 현재 전통시장 활성화에 대한 소비자의 반응을 파악하고, 전통시장 활성화의 중요한 핵심 요인을 도출하고자 한다.

Ⅳ. 연구 방법

1. 데이터 대상 및 범위

기존의 텍스트 마이닝을 활용한 선행 연구들에서는 대부분 SNS 소셜 데이터를 활용하여 빅데이터 분석을 진행하였다. 여기서 SNS 소셜 데이터는 뉴스 기사, 블로그, SNS(FaceBook, Twitter 등)의 게시글 등을 의미한다. 하지만, 이러한 SNS 데이터들을 면밀히 살펴본 결과, 뉴스 기사의 경우 기사가 다양하더라도, 특정 작자(기자)의 주장이 계속해서 인용되어 작성되고 있고 블로그, SNS를 통해서도 게시글을 작성하는 소비자의 의견보다 인용에 대한 내용의 비중이 상당히 높다보니, 이를 크롤링하여 활용한다면 이는 데이터의 객관성이 떨어질 수 있다.

따라서 본 연구에서는 이러한 문제점을 극복하기 위해 네이버 뉴스 기사의 댓글 데이터를 소비자 반응 분석에 활용하였다. 뉴스 기사에 달린 댓글은 정형화되어 있지 않은 형태의 게시글로써, 댓글을 작성하는 작성자의 객관적인 생각과 감정 등이 주를 이루고 있기 때문에 뉴스의 기사에 작성된 댓글 데이터를 분석 대상으로 선정하였다. 네이버 뉴스 플랫폼은 국내에서 가장 큰 온라인 뉴스 플랫폼 중 하나로, 다양한 주제와 관련된 다량의 뉴스 기사와 그에 따른 사용자들의 의견을 담고 있는 댓글을 제공하고 있다. 자료 수집을 위한 키워드를 선정함에 있어 특정 시장 또는 지역시장을 중심으로 텍스트 마이닝 분석을 통해 전통시장 활성화 요인을 도출할 수도 있지만, 본 연구에서는 특정 지역과 특정 시장을 통한 분석 결과를 도출하는 것보다는, 다양한 지역과 시장을 고려하여 키워드를 선정하였고, 이를 통해 편향적이지 않은 결과를 도출하기 위해 ‘전통시장’, ‘전통시장 활성화’를 핵심 키워드로 선정하여 분석을 진행하였다.

본 연구는 전통시장 활성화에 대한 소비자의 반응 변화 동향을 살피기 위해 2020년, 2021년, 2022년, 2023년 7월 현재까지의 데이터를 연구 대상으로 선정하였다. 해당 기간은 코로나19의 발생으로 전통시장이 침체를 맞아 전통시장 활성화를 위한 다양한 정책이 수립되거나 실행되었던 시기와 일치한다. 이러한 데이터를 활용하여 소비자들이 전통시장에 대해 어떻게 반응하고 있는지를 조사하고자 한다.

2. 데이터 수집 및 분석 방법

본 연구에서는 데이터 수집을 위해 웹 크롤링 기법을 활용하였다. 웹 크롤링은 네이버 뉴스 웹사이트에서 다양한 카테고리의 최신 기사와 그에 따른 댓글 데이터를 자동으로 수집하는 과정이다. 이를 통해 대량의 댓글 데이터를 확보할 수 있다. 수집된 데이터는 <그림 2>와 같은 과정을 통해 텍스트 마이닝 기법과 R 프로그래밍 언어를 활용하여 분석하였다. 우선, R을 사용하여 키워드의 빈도 분석을 수행하였다. 또한 단어들의 연관성을 살펴보는 네트워크 분석과 핵심 주제를 도출할 수 있는 토픽 모델링 분석까지 수행하여 소비자들의 직접적인 반응을 분석하였다.

jcr-29-1-121-g2
그림 2. 텍스트 마이닝을 통해 의미 있는 패턴을 도출시키는 과정
Download Original Figure
2.1 데이터 수집

<표 2>와 같이 데이터 수집은 파이썬 언어를 활용한 웹 크롤링 기법을 활용하였고, 핵심 키워드는 ‘전통시장’으로 데이터를 수집하였다. 수집 대상으로는 국내 최대 뉴스 포털 사이트인 네이버(NAVER)를 선택하여 네이버 뉴스의 기사 댓글을 대상으로 수집하였다. 수집 대상 데이터는 2020년 01월 01일부터 2023년 07월 31일까지의 네이버 뉴스의 댓글이 수집 대상이 된다. 이를 토대로 2020년도는 3,548개, 2021년도는 573개, 2022년도는 4,092개, 2023년도는 2,438개의 뉴스 댓글 기사 데이터가 수집되었다.

표 2. 데이터 수집 현황
구분 2020년 2021년 2022년 2023년
수집 기간 2020.01.01.~ 2020.12.31 2021.01.01.~ 2021.12.31 2022.01.01.~ 2022.12.31 2023.01.01.~ 2023.07.31
출처 네이버 온라인 뉴스 기사 댓글
키워드: ‘전통시장’, ‘전통시장 활성화’
수집 방법 웹 크롤링
수집 건수 3,548개 573개 4,092개 2,438개
Download Excel Table
2.2 데이터 전처리

본 연구에서는 수집된 모든 뉴스 기사의 댓글 데이터를 형태소 분석을 진행하였다. 형태소 분석은 R 프로그램을 사용하여 데이터를 수집 후 ‘theeuh’ 라이브러리를 사용하여 한글 문장의 띄어쓰기 문제를 해결한 후, KoNLP 라이브러리와 NIA에서 제공하는 단어사전인 useNIADic()(1,213,109개 단어)를 사용하여 품사가 명사인 단어만 추출하였다. 이를 정교화하기 위해 연구 주제와 관련성이 떨어지는 불용어를 삭제하고, 유사한 의미를 갖고 있는 단어들의 set을 정리하여 하나의 단어로 치환해주는 작업을 거쳐 데이터를 정제하여 빈도 출현 횟수가 높은 100개의 키워드를 도출하여 분석에 활용하였다.

2.3 데이터 분석
2.3.1 텍스트 마이닝(Text Mining)

텍스트 마이닝은 빅데이터 분석 기법 중 하나로 자연어 처리 기술을 기반으로 수집된 데이터에서 유의미한 정보(단어)를 추출하는 작업이며 형태소 분석, 구문 분석, 의미 분석, 화용 분석이 포함되어 있다. 형태소 분석은 텍스트를 의미 있는 단어의 최소 단위로 분리하는 과정, 구문 분석은 텍스트의 문장 구조를 분석하는 과정, 의미 분석은 문자 의미를 해석하는 과정, 화용 분석은 앞선 과정들을 거친 텍스트를 다시 사람이 이해할 수 있는 자연어로 구현하는 작업이다(임광혁, 2017). 텍스트 마이닝은 다른 정보와의 연계성을 파악하여 텍스트가 가진 카테고리를 찾아 단순한 정보 검색 그 이상의 결과를 얻을 수 있다.

2.3.2 키워드 빈도 분석

키워드 빈도 분석은 자주 사용된 단어를 통해 텍스트에서 무엇이 강조되었는지 알 수 있는 분석 방법으로 본 연구에서는 불용어를 제거하고 난 후 상위 10개의 키워드를 도출하였다. 시각화로는 워드 클라우드를 사용하였으며 워드 클라우드는 상위 100개를 기준으로 표현하였다.

2.3.3 네트워크 분석

네트워크 분석은 사람, 사물, 조직 등 분석 대상들 간의 관계를 네트워크로 형성하여, 네트워크의 구조를 계량적으로 표현하고 분석하는 기법으로(김민선, 엄혜미, 2016), 사회과학, 경영학, 응용과학 등 다양한 분야에서 사용되고 있다.

네트워크 분석에서 단어 간의 상관관계를 분석하는 방법은 크게 두 가지로 볼 수 있다. 동시 출현 빈도를 계산하여 단어 간의 상관관계를 파악하는 방법과 파이 계수(phi coefficient)를 활용하여 단어 간의 상관관계를 파악하는 방법이 있다. 동시 출현 빈도를 활용한 네트워크 분석은 특정 단어가 다른 단어에 비해 상대적으로 자주 함께 사용된 단어 쌍을 찾는 방법으로 문서 전체에서 자주 함께 사용되고, 핵심이 되는 단어를 파악할 수는 있으나, 노드의 대부분이 서로 연결되어 구조가 복잡하고 군집이 잘 드러나지 않는 단점이 있다.

반면, 파이 계수란 특정 두 단어가 함께 사용되는 경우가 각각 사용되는 경우에 비해 얼마나 많은지를 나타내는 지표로, 상대적으로 관련성이 큰 단어쌍을 파악하는 데 유용한 방법이다. 따라서 관련성이 큰 단어끼리만 네트워크가 연결되어 있고, 군집이 명확하게 드러나기 때문에 밀접하게 관련된 단어쌍을 파악할 때 활용된다.

2.3.4 토픽 모델링

토픽 모델링은 문서 집합의 추상적인 "주제"를 발견하기 위한 통계적 모델 중 하나로, 텍스트 본문의 숨겨진 의미구조를 발견하기 위해 사용되는 텍스트 마이닝 기법 중 하나이며, 토픽은 문서의 주제로서 문서에서 자주 등장하는 단어들로 추론되는 내용적 특성을 뜻한다. 이에 토픽 모델링은 디지털 미디어에서 생산되는 텍스트의 폭발적 증가와 함께 그 활용 범위와 가치가 매우 높아지는 추세다. 전통적 내용분석의 방법으로는 가능하지 않았던 방대한 크기의 텍스트 자료를 효율적으로 다뤄 자료에 기반하여 그 의미를 파악하고 주제적 특성을 도출하는 방법으로 토픽 모델링이 활용될 수 있기 때문이다. 무엇보다 토픽 모델링은 의제(agenda) 분석이나 프레임 분석과 같이 내용분석으로 미디어 텍스트의 특성을 도출해 의미를 추론하는 연구에 있어 전통적 방법을 보완하는 것을 넘어 대안으로 그 가능성이 활발하게 논의되고 있다(이준웅, 김성희, 2018; Maier et al., 2018; Walter & Ophir, 2019).

또한 토픽 모델은 원래 개발된 목적인 텍스트 마이닝 분야 이외에도 유전자 정보, 이미지, 네트워크와 같은 자료에서 유의미한 구조를 발견하는 데 유용하게 사용되고 있으며 LDA, sLDA, HDP, hLDA, PAM 등 다양한 형태의 모형을 가지고 있다. 본 연구에서는 LDA모형을 활용하였다. 그 이유는 비교적 단순한 구조를 가진 LDA는 복잡한 데이터 구조를 모델링하는데 있어서, sLDA, HDP, hLDA, PAM 등과 같은 복잡한 모델들에 비해 상대적으로 빠른 학습과 추론 시간을 제공하며, 다양한 유형의 데이터셋에 대한 우수한 성능과 높은 결과 해석 가능성을 가지기 때문이다.

2.3.4.1 LDA(Latent Dirichlet Allocation)

본 연구에서 사용된 모델인 LDA(잠재 디리클레 할당, Latent Dirichlet allocation)는 주어진 문서에 대하여 각 문서에 어떤 주제들이 존재하는지를 서술하는 확률적 토픽 모델 기법 중 하나이다. <그림 3>에서 제시된 그림처럼 추출된 토픽의 단어 비중과 문서의 토픽 비중이라는 두 변수가 모두 양의 실수를 요소로 가지며, 모든 요소를 더한 값이 1이 되는 Dirichlet 분포를 따르는 알고리즘이다(Blei, 2012). 특히 하나의 문서가 여러 토픽과 동시에 대응되는 알고리즘이기 때문에 현실의 현 현상에 대한 모델링에 적합한 기법으로 평가받고 있다.(Yang & Yang, 2022).

jcr-29-1-121-g3
그림 3. LDA 모형 구조
Download Original Figure

본 연구에서는 기존의 구조화된 측정도구로 포착하기 어려운 소비자들의 실제 니즈와 문제, 관심사들을 텍스트 마이닝 기법의 하나인 토픽 모형 분석을 통해 파악하고, 이를 분석함으로써 전통시장 활성화의 핵심 요인을 도출하여 향후 지원 정책 및 방향성에 시사점을 제공하는 데 목적이 있다. 구체적으로 뉴스 기사, 블로그 등 SNS 데이터를 사용한 기존의 텍스트 마이닝 연구들과는 달리 다양하고 직관적인 댓글 데이터를 활용하여 전통시장 소비자들의 실질적인 반응을 확인하고, 이에 따른 핵심 요인을 도출하는 것이 올바른 전통시장 활성화 지원 정책을 수립하는 데 효과적인 접근이라 할 수 있다.

Ⅴ. 연구

1. 키워드 빈도 분석

본 연구에서는 ‘전통시장’, ‘전통시장 활성화’를 검색어로 수집된 4,337개의 뉴스 댓글 데이터 중에서 형태소 분석 결과 명사로 추출된 단어(두 글자 이상)는 4,801개로 이 중 불용어를 제외한 후 핵심 키워드 20개를 추출하여 분석하였다. 키워드 빈도 분석에서는 데이터 수집 기간 동안의 분석을 연도별로 구분하여 진행하였다. 소비자들의 감정과 관심사가 시간의 흐름에 따라 변화할 수 있기 때문에, 이 변화를 정확하게 파악하는 것이 해당 시기의 사회적, 경제적 트렌드 및 추세를 이해하는 데 중요한 역할을 하고 이를 이해함으로써 전통시장 활성화를 위한 시기적절한 핵심 요인을 도출할 수 있다고 판단하였기 때문에 연도별 분석을 개별로 진행하여 결과를 분석하였다. 그 결과 연도 별 상위 빈도 단어 결과는 다음 <표 3>과 같다. 분석 결과 모든 연도에서 도출된 키워드의 방향성, 트렌드가 크게 다르지 않다는 것을 알 수 있었다. 또한, 대부분의 도출된 키워드를 통해 전통시장과 관련하여 부정적인 단어들이 도출되었다는 것 또한 알 수 있었다. 이는 지속적으로 전통시장을 이용하고, 방문하는 데에 있어 발생하는 문제점들이 개선되지 않고, 해결되지 않음을 알 수 있다.

표 3. 전통시장 활성화 단어 빈도 분석표
순위 2020년 2021년 2022년 2023년
1 대형마트 주차 대형마트 백종원
2 규제 사람 주차 사람
3 주차 정부 사람 대형마트
4 사람 세금 카드 지역
5 카드 대형마트 현금 주차
6 식자재 규제 가격 장사
7 불편 소상공인 불편 예산
8 가격 카드 휴무 상인
9 정책 정책 위생 본인
10 물건 지역 물건 투자
11 정부 지원 규제 민생
12 현금 경제 동네 경제
13 위생 상인 상인 정치
14 세금 중국 불친절 회사
15 불친절 추석 일요일 방송
16 상인 동네 정책 시민
17 장사 쿠팡 장사 대통령
18 동네 불편 온라인 세금
19 경제 시민 소상공인 철거
20 시간 현금 대통령 바가지
Download Excel Table
1.1 2020년 키워드 빈도 분석

<그림 4>의 워드 크라우드에서 보여지는 것과 같이, 2020년도 키워드 분석 결과 출현 빈도가 높은 상위 그룹의 단어를 살펴보면 대형마트(1,344)가 상대적으로 월등히 높은 빈도를 나타내고 있고, 뒤이어 규제(410), 주차(349), 사람(337), 카드(328), 식자재(242), 불편(240), 가격(218), 정책(198) 등이다. 이를 통해 전통시장 활성화를 위해서는 대형마트와의 상생 방안에 대한 고민이 필요하며, 대형마트와의 차별화된 활성화 정책이 마련되어야 할 필요성이 있음을 알 수 있다. 또한, 주차, 카드, 불편 등 전통시장을 이용함에 있어 전통시장에 입주한 소상공인의 가격 정책 및 카드 사용 또는 전통시장의 낙후된 주차 등의 시설 문제 등이 여전히 소비자에게 큰 문제점으로 도출되고 있음을 파악할 수 있다.

jcr-29-1-121-g4
그림 4. 2020년도 전통시장 활성화 단어 워드 클라우드
Download Original Figure
1.2 2021년 키워드 빈도 분석

<그림 5>의 워드 크라우드에서 보여지는 것과 같이, 2021년도 뉴스 기사 댓글 데이터를 살펴보면 여전히 주차(32), 사람(30), 대형마트(19), 규제(17), 카드(16) 등이 상위에 노출되는 것을 확인할 수 있다. 2020년도와 비교해보면 정책(15), 지원(15), 중국(12), 쿠팡(11) 등의 단어들을 보아 코로나로 인한 영향으로 전통시장의 이용이 줄어 온라인 쇼핑(쿠팡 등)이 등장하였고, 그런 와중에도 소상공인을 위한 전통시장 활성화를 위해 다양한 정책 및 지원들에 소비자들은 관심을 가졌던 것으로 확인할 수 있다.

jcr-29-1-121-g5
그림 5. 2021년도 전통시장 활성화 단어 워드 클라우드
Download Original Figure
1.3 2022년 키워드 빈도 분석

<그림 6>의 워드 크라우드에서 보여지는 것과 같이, 2022년도 뉴스 기사 댓글 데이터를 살펴보면 역시 대형마트(1,477), 휴무(173), 일요일(94), 온라인(75) 등으로 보아 전통시장 활성화에 있어서 대형마트와의 상생, 휴무 및 주말 운영에 대한 관심, 전통시장의 온라인 플랫폼화 등에 대한 관심이 높아지고 있음을 확인할 수 있다.

jcr-29-1-121-g6
그림 6. 2022년도 전통시장 활성화 단어 워드 클라우드
Download Original Figure

또한 주차(308), 카드(283), 현금(214), 가격(200), 물건(161), 불친절(102) 등이 상위권 노출 순위에 있는 것으로 보아 전통시장 활성화에 대한 고질적인 장애물은 전통시장의 낙후된 주차시설, 카드 사용에 대한 거부감 및 현금 사용 권유 및 상품의 품질 및 가격이 소비자들에게 주는 불만족 등이 있음을 확인 할 수 있다.

1.4 2023년 키워드 빈도 분석

<그림 7>의 워드 크라우드에서 보여지는 것과 같이, 2023년도 뉴스 기사 댓글 데이터를 살펴보면 대형마트(120), 주차(71) 등의 문제는 높은 빈도로 노출되고 있음을 알 수 있고 특별하게 2023년에는 기업인이자 방송인인 백종원을 중심으로 한 예산시장에관한 프로젝트가 이슈가 되면서 백종원(175), 예산(65), 방송(46) 등이 관련 키워드로 도출되었음을 알 수 있다.

jcr-29-1-121-g7
그림 7. 2023년도 전통시장 활성화 단어 워드 클라우드
Download Original Figure
2. 네트워크 분석

앞서 단어 빈도 분석 결과, 2021년도 코로나19 특수로 인한 특정 단어의 빈도가 높았던 것과 2021년도 백종원과 예산시장에 대한 관심도가 높아져 관련 키워드가 상위권에 노출된 것을 제외하면, 연도별 단어 특성이 차별화되지 않는 점을 감안하여 연도 별로 구분하는 것이 연구 결과에 영향을 끼치지 못할 것으로 판단되어 네트워크 분석부터는 모든 년도의 뉴스 기사 댓글 데이터를 통합하여 분석을 진행하였다.

네트워크 분석은 각 단어들의 관계를 통해 전통시장 활성화 방안을 도출하는 것이 본 연구의 목적이기 때문에 단어 간의 밀접한 상관 관계를 파악할 수 있는 파이 계수를 활용하여 분석을 진행하였다. 키워드 빈도 분석 결과로 도출된 핵심 키워드를 중심으로 ‘대형마트’, ‘환경’을 각 카테고리의 핵심 키워드로 결정하였고, 추가적으로 진행 중인 지원 정책에 대한 방향성 및 실효성 검증의 목적이 있기 때문에 추가적으로 ‘정책’이라는 키워드를 카테고리 주제로 선정하였다. 그리고 각 카테고리별 핵심 키워드와 상관관계가 높은 단어 10개씩을 추출하였다.

분석 결과 <그림 8>과 같이 ‘대형마트’ 와 관련하여 중요도가 높게 나온 단어는 ‘휴무’, ‘규제’, ‘주말’ 등으로 대형마트의 의무휴업 규제와 관련하여 전통시장 소비자들의 관심이 가장 의미 있는 주제로 도출되었다. 해당 키워드와 관련된 댓글의 데이터를 살펴보면 ‘사람들은 마트 쉬는 날 장을 안 본다.’, ‘대형마트 규제한다고 시장 안간다.’, ‘대형마트의 규제는 해제 돼야 해요.’ 등의 댓글을 보아 전통시장 활성화를 위한 대형마트의 의무휴업 규제가 소비자들에게 오히려 불편을 야기하고 전통시장 활성화로 이어지지 않고 있음을 알 수 있다.

jcr-29-1-121-g8
그림 8. 전통시장 활성화 기사 댓글 주요 단어 상관 계수(파이 계수)
Download Original Figure

또한, ‘환경’과 관련하여 가장 중요도가 높게 나온 키워드를 살펴보면 ‘개선’, ‘깨끗’ , ‘활성화’, ‘개발’, ‘발전’, ‘정찰제’, ‘가격’, ‘주변’, ‘여름’, ‘시민들’, ‘공간’ 등이 도출되었다.

‘정책’과 관련하여 파이 계수가 높은 단어들을 살펴보면, ‘불편하게’, ‘정부’, ‘대책’, ‘시장경제’, ‘효과’, ‘반대’, ‘서민’, ‘인간들’, ‘쇼핑몰’, ‘경쟁력’ 등이 상위빈도로 도출되었다.

<그림 9>와 같이 파이 계수를 바탕으로 단어들의 상관관계를 네트워크 그래프로 나타내보면 단어들의 연관성을 더욱 효율적으로 분석할 수 있다. 네트워크 그래프는 각각 도출된 단어들은 점(노드)으로 표기되어 있음을 알 수 있고, 상관관계가 있을 경우에는 선(링크)으로 연결되어 있음을 알 수 있다. 점(노드)의 크기가 클수록 해당 네트워크에서 핵심 단어일 가능성이 높음을 의미하고 있다.

jcr-29-1-121-g9
그림 9. 전통시장 활성화 단어 네트워크 그래프
Download Original Figure

네트워크 그래프 결과, ‘대형마트’를 중심으로 ‘규제’, ‘주말’, ‘휴무’ 등의 키워드와 ‘온라인’을 중심으로 한 ‘쇼핑몰’, ‘쇼핑’, ‘배송’, ‘쿠팡’ 등의 키워드가 네트워크가 연결되어 있는 것으로 보아 전통시장과 경쟁자의 위치에 있는 대형마트와 온라인 쇼핑에 대한 소비자들의 관심이 높고, 이들과 경쟁 및 상생할 수 있는 전통시장만의 전략이 필요함을 알 수 있다.

또한, ‘환경’ 이라는 카테고리로 묶었던 단어들의 네트워크를 살펴보면 ‘카드’를 중심으로 ‘결제’, ‘사용’, ‘눈치’, ‘현금’, ‘유도’, ‘주차’, ‘불편’, ‘위생’, ‘가격’ 등 다양한 시설 환경과 관련된 단어들이 하나의 네트워크를 이루고 있어 전통시장 활성화 전체 네트워크에서 의미가 높은 네트워크를 형성하고 있음을 알 수 있다.

3. 토픽 모델링 분석

본 연구에서는 토픽 모델링 분석 방법에 LDA 알고리즘을 활용하였으며 최적의 토픽 개수를 설정하기 위해 2부터 20까지 설정하여 토픽 모델링 성능 지표를 비교하였고 <그림 10>의 성능 지표 그래프의 결과를 토대로 최종 토픽 모델은 8개로 선정하였다.

jcr-29-1-121-g10
그림 10. 전통시장 활성화 단어 하이퍼 파라미터 성능지표 그래프
Download Original Figure

토픽 모델링 분석을 위해 총 66,695개의 단어를 형태소 분석하여 추출한 후 중복단어를 제거하고 빈도수가 다른 단어들보다 과도하게 높다보면 주제가 편향되어 객관성 있는 주제를 도출할 수 없기 때문에 이번 연구에서는 빈도수가 200을 초과하는 단어는 제거하였다. 이렇게 도출된 단어 44,751개에 대하여 의미가 비슷한 단어에 대해서 단어 치환 및 불용어 처리를 하여 토픽 모델링 분석을 실시하였다. 불용어를 제거한 후 토픽 별 beta값을 추출하여 beta값이 높은 상위 10개의 단어를 토픽별로 추출하였고 결과는 <그림 11>, <그림 12>와 같다.

jcr-29-1-121-g11
그림 11. 전통시장 활성화 단어 토픽별 상위 Top 10
Download Original Figure
jcr-29-1-121-g12
그림 12. 전통시장 활성화 단어 토픽별 주요 단어 및 빈도 수
Download Original Figure

각 토픽별 상위로 도출된 키워드들을 종합하여 토픽의 주제를 <표 4>와 같이 정리할 수 있다.

표 4. 전통시장 활성화 LDA 결과 토픽명
Topic 토픽명
1 대형마트와의 차별화 및 경쟁력 부족
2 예산시장의 사례를 통한 활성화 방안 모색
3 소비자의 합리적 선택을 위한 자체 경쟁력 강화
4 전통시장 시설 환경 및 위생 개선
5 지역 및 주변 상권 강화 활용
6 온라인 쇼핑 플랫폼과의 상생 방안
7 소비자를 대하는 상인들의 태도 개선
8 주말 및 휴일 영업을 통한 소비자 요구 충족
Download Excel Table

Ⅵ. 결론

1. 분석 결과

도시화와 현대화로 인해 소비자의 생활 방식의 변화, 경제적인 문제와 동네 상권의 변화와 도시 개발 정책 등 다양한 변화 속에서 전통시장은 오랜 기간 위축되어 왔다. 전통시장의 수는 계속해서 줄어들고 있고, 이를 활성화하기 위해 정부 및 지자체 등에서는 다방면에서 지원을 아끼지 않고 있다. 그럼에도 불구하고 전통시장의 활기를 되찾고, 다양한 유통산업에서 경쟁력이 부족한 것이 현실이다. 본 연구에서는 전통시장을 직접 이용하는 소비자들의 반응을 파악하기 위하여 텍스트 마이닝 기법을 활용하여 수집된 전통시장 활성화와 연관된 뉴스 기사에서 추출된 데이터로부터 소비자들의 반응을 연구하여 실효적인 전통시장 활성화 방안을 탐색하였다.

본 연구에서는 2020년도부터 2023년 7월까지의 전통시장 활성화와 관련된 뉴스 기사의 댓글을 웹 크롤링 방식으로 수집하여 대상 데이터로 선정하였고, 이를 연도별로 분류하여 단어 빈도분석을 진행하였다. 해당 결과는 <표 5>의 제시된 결과와 같다.

표 5. 전통시장 활성화 단어 빈도 분석표
순위 2020년 2021년 2022년 2023년
1 대형마트 주차 대형마트 백종원
2 규제 사람 주차 사람
3 주차 정부 사람 대형마트
4 사람 세금 카드 지역
5 카드 대형마트 현금 주차
6 식자재 규제 가격 장사
7 불편 소상공인 불편 예산
8 가격 카드 휴무 상인
9 정책 정책 위생 본인
10 물건 지역 물건 투자
11 정부 지원 규제 민생
12 현금 경제 동네 경제
13 위생 상인 상인 정치
14 세금 중국 불친절 회사
15 불친절 추석 일요일 방송
16 상인 동네 정책 시민
17 장사 쿠팡 장사 대통령
18 동네 불편 온라인 세금
19 경제 시민 소상공인 철거
20 시간 현금 대통령 바가지
Download Excel Table

특히, <그림 13>의 그래프에서 알 수 있듯이, 단어 빈도분석 결과에서 두드러지는 특징은 ‘대형마트’, ‘주차’, ‘카드’ 등의 단어가 계속해서 상위권에 도출되는 점으로 보아 해결되지 않는 소비자들의 불편과 요구가 있는 것으로 판단된다.

jcr-29-1-121-g13
그림 13. ‘대형마트’, ‘주차’ 키워드 연도별 순위 변화 그래프
Download Original Figure

해당 단어와 관련된 뉴스의 댓글을 직접 살펴보면 먼저, 대형마트와의 비교를 통한 전통시장의 문제점을 표현한 댓글이 가장 많았다. 이를 통해 대형마트와 경쟁 우위를 점할 수 있는 전통시장만의 장점 및 매력도를 찾아 적극 마케팅에 활용해야 할 필요성이 있음을 알 수 있다.

또한, 주차시설 부족 및 노후화된 시설에 대한 불만을 표현한 댓글도 빈도수가 높았고, 카드 사용을 꺼려하고 현금 사용을 유도하는 상인들의 태도에 대해서도 소비자들의 불만이 많은 것으로 나타났다.

이를 통해 전통시장 활성화를 위해서는 대형마트와 비교하여 차별화를 둘 수 있는 정책 및 지원 또는 마케팅 전략이 필요할 것으로 보이며, 주차 시설 및 다양한 시설에 대한 개선 정책, 전통시장 상인들에 대한 카드 수수료 지원 등에 대한 정책이 필요할 것으로 판단된다.

특별하게 연도별 키워드 빈도 분석 결과, 연도별 차이가 발생한 내용으로는 2023년도 데이터에서 높은 빈도를 나타내었던 ‘백종원’, ‘예산’ 등의 단어를 바탕으로 기업인이자 방송인 백종원이 전통시장과 지역을 살리기 위해 수행하였던 지원 및 솔루션을 본보기로 삼아 지역의 특색과 기업의 투자 유치 등의 방법을 고려하여 전통시장의 활기를 찾을 수 있는 방안도 모색할 필요가 있다고 생각한다.

단어들 간의 상관관계를 바탕으로 네트워크 그래프를 그려 분석한 네트워크 분석의 결과를 보면 단어 빈도분석 결과와 매우 유사하다는 것을 알 수 있다. 네트워크 그래프에서 가장 핵심이 되는 노드의 주변 단어들을 살펴보면, ‘카드’, ‘현금’, ‘주차’, ‘카트’, ‘위생’ 등의 시설과 환경과 연관되어 있는 단어들이 ‘불친절’, ‘불편’ 등의 단어와 밀접하게 연관되어 있는 것으로 보아 전통시장 시설 또는 주변 환경, 주차 시설 등에 대한 지원을 통해 개선이 필요함을 알 수 있고, ‘대형마트’, ‘식자재’, ‘온라인’, ‘쇼핑몰’, ‘쿠팡’, ‘마켓 컬리’ 등의 단어가 상대적으로 연관성도 있고 노드의 크기도 크기 때문에 의미가 있음을 알 수 있다. 따라서 전통시장이 대형마트나 SSM(기업형 슈퍼마켓) 등과 같은 기타 유통 시설과의 경쟁, 온라인 쇼핑몰 플랫폼과의 상생을 위한 다양한 대책 마련이 필요할 것으로 생각된다.

토픽 모델링 분석 결과로는 하이퍼 파라미터 튜닝을 통해 2번에서 20번 사이의 성능 지표를 비교한 결과 8개의 토픽을 도출하게 되었고, 토픽을 유사한 의미별로 그룹핑하여 정리하면 다음과 같다.

첫 번째로 도출된 핵심 요인은 대형마트, 온라인 쇼핑몰 플랫폼과의 차별화된 장점이 있어야 한다는 점이다. 최근 전통시장은 대형마트와 편의점 등과 같은 일명 기업형 슈퍼마켓(SSM)뿐만 아니라 인터넷 쇼핑몰, 모바일 커머스, 소셜 커머스 등과 치열한 경쟁을 하고 있다. 더불어 4차 산업혁명과 포스트코로나(Post COVID-19) 시대로 비대면 문화가 보편화되면서 전통시장의 침체는 가속화되고 있다. 따라서 이러한 경쟁에서 전통시장이 살아남기 위해서는 디지털화, 시설 현대화, 문화관광 특화 등 차별화된 전략을 마련하여야 한다(조현진 외, 2023). 또한, 대형마트 의무휴업 규제를 적극 활용하여 경쟁력을 갖춘 전통시장이 대형마트 의무휴업 기간 동안 대형마트를 대체할 수 있는 대체제가 된다면, 의무휴업 기간이 아닌 기간에도 충분히 경쟁할 수 있을 것으로 생각된다.

두 번째로는, 전통시장 성공 사례를 바탕으로 전통시장만의 자체 경쟁력을 강화해야 한다. 올해 기업인이자 방송인인 백종원과 예산군의 상호 협약을 통해 예산시장을 중심으로 한 ‘예산형 구도심 지역생성 프로젝트’가 추진되었고 2023년 1월 완전히 새롭게 변화한 예산시장을 개장하였고 개장한 지 한 달만에 10만 명 이상이 찾는 대표적인 전통시장 활성화 성공 사례로 꼽히고 있다. 이처럼 기업의 투자 유치, 주변 상권과의 상생, 지역의 특색을 살린 문화 관광 특화 등 전통시장 자체의 경쟁력을 높여 소비자들이 보다 합리적인 선택을 통한 소비를 할 수 있도록 해야 한다.

세 번째로는 전통시장 시설 및 환경에 대한 개선이다. 키워드 빈도 분석과 네트워크 분석, 토픽 모델링 분석 모두에서 지속적으로 도출되고 있는 핵심 문제는 노후화된 시설, 환경과 관련된 소비자들의 불만이었다. 따라서 전통시장의 시설 현대화와 더불어 주변 시설(공간)에 대한 개조 및 개선, 주변 상권 활성화를 통해 전통시장 소비자 유입을 증가시킬 필요가 있을 것이다.

네 번째로는 시설, 환경에 대한 개선과 더불어 경영 환경에 대한 개선이 필요하다. 본 연구 결과에서 유의미하게 도출된 주제 중 하나는 상인들에 대한 소비자들의 태도 및 서비스에 대한 불만이었다. 특히, 카드 사용을 지양하고 현금 사용을 유도하는 상인들의 태도가 대표적이다. 이러한 문제점을 개선하기 위해서는 상대적으로 고령화된 전통시장 상인들에 대한 서비스 및 경영 교육이 필요할 것이며, 카드 결제 및 결제 간편 시스템 도입, 결제 수수료 지원 등 다양한 정책적 지원이 필요할 것으로 보인다.

2. 지원 정책 연관성 비교

<표 6>의 내용과 같이 본 연구를 통해 대형마트, 온라인 쇼핑몰 플랫폼과의 차별화된 정책의 필요성, 전통시장 및 주변 시설 환경 개선의 필요성, 전통시장 경영 환경 개선의 필요성, 전통시장 자체 경쟁력 강화의 필요성이라는 핵심 요인을 도출하였다. 본 연구를 통해 도출된 요인들이 현재 진행되고 있는 정책들과의 비교를 통해 소비자들의 문제를 해결하고자 하는 올바른 방향으로 지원 및 정책이 진행되고 있는지 비교해보았다. 비교 정책으로는 중소벤처기업부에서 진행하고 있는 지원사업을 기준으로 비교해보았다.

표 6. 전통시장 활성화 핵심 요인 및 관련 지원사업 연관성
전통시장 활성화 핵심 요인 관련 지원 사업
1 대형마트, 온라인 쇼핑몰 플랫폼과의 차별화 정책 특성화시장 육성
(디지털 전통시장)
청년몰 활성화 및 확장 지원
2 전통시장 및 주변 시설 환경 개선 청년몰 조성사업
화재알림 시설 설치 사업
노후전선 정비 사업
주차환경 개선 사업
3 전통시장 경영 환경 개선 시장경영 패키지지원
특성화시장 육성
(첫걸음 기반조성)
4 전통시장 자체
경쟁력 강화
특성화시장 육성 (문화관광형)
지역상품 전시회
Download Excel Table

본 연구 결과의 핵심 요인과 중소벤처기업부에서 진행되고 있는 전통시장 활성화 지원사업과 비교해본 결과, 도출된 핵심 요인과 관련된 지원사업은 지속적으로 진행 중인 것으로 나타났다. 그럼에도 불구하고 해마다 소비자들의 불만이 해소되지 않고 문제점이 드러나는 것에 대해서 관련 지원사업의 실효성에 대한 점검이 필요할 것으로 보인다. 더욱 소비자들의 불만과 불편함을 구체화하여 해결할 수 있는 방안을 모색하거나, 지원 금액의 증가로 효과적인 결과를 도출할 수 있는 정책이 필요할 것으로 보인다.

3. 시사점

본 연구는 전통시장 활성화 방안에 대해서 소비자들의 직접적인 반응을 참고하기 위해 뉴스 기사의 댓글을 활용하여 텍스트 마이닝 기법을 통해 분석하였다는 데 이론적 시사점이 있다. 특히, 단순히 단어에 대한 빈도분석만 진행한 것이 아니라, 네트워크 분석과 토픽 모델링 분석을 통한 소비자 반응의 핵심 요인을 도출해 낼 수 있는 분석 방법을 활용하여 의미 있는 결과를 도출하였다는 데 의미가 있다.

본 연구의 실무적 시사점으로는 전통시장 활성화를 위한 핵심 요인을 도출하였고, 이를 관련 지원 정책과 비교하여 현 지원 정책의 방향성 및 실효성 분석을 진행하였다는 데 시사점이 있다. 또한, 이를 바탕으로 향후 전통시장 활성화와 관련된 많은 정부 및 지자체 기관들에게 전통시장 활성화를 위한 지원 정책의 인사이트를 제공할 수 있다는 데 시사점이 있다.

4. 한계점 및 향후 연구 방향

본 연구에서는 몇 가지의 한계점들이 존재한다. 먼저는 데이터 수집 및 분석 방법의 한계가 있다. 수집기간이 제한적이었던 점, 특히 본 연구의 수집 대상인 2020년도 이후는 코로나19의 영향으로 비교적 전통시장에 대한 소비자들의 의견이 부정적일 수밖에 없었을 것이다. 이를 극복하고자 향후 연구에서는 데이터 수집 기간을 확대하여 소비자들의 반응 추이에 대한 분석이 필요할 것이다. 또한, 비정형화된 데이터를 정형화된 데이터로 변환할 때의 성능 문제의 한계점이 있다. 또한, 한글 단어의 특징 때문에 R프로그래밍의 텍스트 마이닝 패키지(tm Package)를 그대로 사용할 수 없다는 점과 기존의 단어추출 패키지의 정확도가 부족하기 때문이다. 따라서 향후 텍스트 마이닝 기법을 활용한 연구에서는 한글 데이터를 좀 더 정확하게 정제할 수 있는 고도화된 형태소 분석 방법론이 필요할 것으로 보인다. 추가적으로 본 연구는 토픽 모델링 방법론을 중심으로 전통시장 활성화를 위한 핵심 요인을 도출하였으나, 현재 토픽 모델링 방법론은 컴퓨터 공학 분야에서 빠른 속도로 발전이 진행되고 있기 때문에 해당 방법론만으로는 전통시장 활성화를 위한 타당한 해결책을 도출하는 데에는 한계점이 존재할 수 있다. 따라서 향후 연구에서는 더 다양한 분석 방법론을 활용하여 전통시장 활성화를 위한 핵심 요인을 도출하는 분석 결과에 신뢰성을 확보할 필요가 있다.

두 번째는 전통시장 일반화로 인해서 존재하는 한계점이 있다. 본 연구에서는 전국의 전통시장을 ‘전통시장’ 이라는 단어로 통합하여 일반화시켜 분석을 진행하였기 때문에 지역적 특색, 개별 전통시장의 특색 등을 고려하여 분석을 진행할 수 없었다. 각 지자체, 정부, 전통시장 상인회 등의 노력으로 전통시장 활성화가 잘 이루어지는 전통시장도 있을 것이고, 반면에 어떠한 이유로 쇠퇴해가고 있는 전통시장도 있을 것이다. 전통시장의 활성화 정도, 지역적 특성 등을 활용하여 그룹화하고 세분화하여 소비자들의 반응을 연구한다면 본 연구보다 구체적이고 실효적인 요인들이 도출될 것이라고 생각된다.

마지막으로는 수집된 데이터의 유형과 분석 방법의 다양성에서의 한계점이 있다. 본 연구는 뉴스 기사의 댓글을 수집하여 분석하였기 때문에 전통시장을 방문하지 않은 사람들의 의견도 포함되어 있다. 전통시장을 방문한 소비자들을 대상으로 설문을 통해 직접적으로 경험한 의견 등을 추가적으로 수집하여 분석에 활용이 필요하다. 또한 본 연구에서 사용한 토픽 모델링 외에도 감성 분석 등과 같은 다양한 분석 방법을 적용하여 보다 신뢰할 수 있는 결과를 제공해야 할 것이다.

Notes

본 연구는 제1저자의 석사학위 논문을 바탕으로 작성함.

This research is based on the first author's master's thesis.

참고문헌

1.

고호석 (2019). 수정된 중요도-성취도(IPA) 분석을 통한 전통시장 서비스품질에 대한 이용고객 평가 분석-창원시 전통시장을 중심으로. 지역산업연구, 42(3), 141-159.

2.

김민선, 엄혜미 (2016). 키워드 네트워크를 이용한국내 관광연구의 최근 연구동향 분석. 한국산학기술학회논문지, 17(9), 68-73.

3.

김승욱 (2012). 스마트 전통시장으로의 발전을 위한 실증연구. e-비즈니스연구, 13(3), 139-157.

4.

김종국 (2008). 한국 재래시장의 유형분류와 전략적 유형정의에 관한 연구(박사학위논문). 숭실대학교 대학원.

5.

김준식, 김종진 (2012). 전통시장 활성화 모형구축에 관한 연구. 사회과학논총, 28(1), 65-86.

6.

김제선 (2021). 코로나 19 상황에서 고객만족이 전통시장의 재방문의사에 미치는 영향. 인문사회 21, 12(5), 817-832.

7.

박상훈, 이희정 (2018). 소셜 빅데이터를 이용한 전통시장 활성화 요인 도출 연구-서울시 망원시장과 수유시장을 대상으로-. 서울도시연구, 19(3), 1-18.

8.

소상공인시장진흥공단 (2022). 2022년 전통시장·상점가및점포경영실태조사. 소상공인시장진흥공단 연구보고서.

9.

송부용, 권성오 (2001). 2001년 창원시 유통발전 세미나 발표논문: 창원지역 재래시장 활성화와 지원방안. 마케팅과학연구, 7(1), 25-29.

10.

이성호, 최진 (2021). 전통시장 활성화 방안이 전통시장의 소매점 자산과 이용의도에 미치는 영향. 유통연구, 26(4), 23-48.

11.

이준웅, 김성희 (2018). 미세먼지 재해 보도의 프레임 분석: 구조적 주제모형(Structural Topic Modeling)의 적용. 한국언론학보, 62(4), 125-158.

12.

이준호, 김영, 김경훈 (2013). 전통시장 시설현대화사업이 전통시장 활성화에 미치는 영향 분석: 진주중앙유등시장을 중심으로. 한국지역개발학회지, 25(1), 233-249.

13.

임광혁 (2017). SNS 빅데이터 분석 기술 동향 및 발전방향. 한국컨텐츠학회, 15(1), 38-43.

14.

장흥섭 (2010). 대구 전통시장의 과거·현재·미래. 경북대학교 출판부.

15.

장흥섭 (2018). 해외 선진 전통시장을 통한 한국 전통시장의 활성화 방안: 전통시장 활성화를 위한 새로운 접근. 경영교육연구, 33(3), 153-173.

16.

정영라 (2020). 관광목적지로서의 전통시장 방문동기에 따른 시장세분화 분석: 서촌 통인시장을 중심으로. 관광레저연구, 32(5), 5-30.

17.

조규호 (2014). 전통시장 생존 가능한가?: 전통시장과 대형마트 이용객의 구매 만족도 및 정부 관련정책 인식도에 관한 비교분석을 중심으로. 유통경영학회지, 17(6), 29-41.

18.

조현진, 김상덕, 안시연 (2023). 대형쇼핑몰 입점에 대한 전통시장의 대응전략 -강동구 전통시장 사례-. 유통물류연구, 10(2), 99-114.

19.

최인혁, 김훈구(2017). 전통시장의 물리적 환경과 접근편의성이 매출액에 미치는 영향: 대도시 전통시장 중심으로. 물류학회지, 27(6), 147-157.

20.

Blei, D. M. (2012). Probabilistic topic models. Communications of the ACM,55(4), 77-84.

21.

Maier, D. et al. (2018). Applying LDA topic modeling in communication research: Toward a valid and reliable methodology. Communication Methods and Measures, 12(2-3), 93-118.

22.

Yang, W. R. & Yang, H. C. (2022). Topic modeling analysis of social media marketing using BERTopic and LDA. Journal of Industrial Distribution & Business, 13(9), 37-50.

23.

Walter, D. & Ophir, Y (2019). News frame analysis: An inductive mixed-method computational approach. Communication Methods and Measures, 13(4), 248-266.