본문 바로가기
카테고리 없음

공공데이터 다운로드부터 엑셀 분석까지 따라하기 — 초보자 실전 가이드

by 축제 지식만땅 2026. 2. 11.

공공데이터 찾기부터 다운로드까지 — 처음 사용하는 사람 기준 전체 흐름

공공데이터를 활용해 분석을 해보고 싶지만 어디서부터 시작해야 할지 몰라 포기하는 경우가 많다. 사이트에 들어가 보면 자료는 많은데 메뉴가 복잡하고, 파일 형식도 낯설어서 어렵게 느껴진다. 하지만 실제 흐름은 몇 단계만 이해하면 반복적으로 사용할 수 있을 만큼 단순하다. 먼저 포털 사이트에서 공공데이터포털을 검색해 접속한다. 공공데이터 다운로드부터 엑셀 분석까지 따라하기- 초보자 실전가이드에 대해 이야기 해보도록 하겠습니다.

 

공공데이터 다운로드부터 엑셀 분석까지 따라하기 — 초보자 실전 가이드
공공데이터 다운로드부터 엑셀 분석까지 따라하기 — 초보자 실전 가이드


로그인은 필수는 아니지만, 데이터 다운로드나 활용 신청이 필요한 자료가 있기 때문에 가입해 두는 것이 편하다. 가입 절차는 일반 웹사이트와 거의 동일하다.

접속 후 가장 먼저 할 일은 검색어를 구체적으로 정하는 것이다. 초보자가 가장 많이 하는 실수가 너무 넓은 키워드를 넣는 것이다. 예를 들어 “취업”, “창업”, “인구”처럼 광범위한 단어를 검색하면 결과가 지나치게 많아진다. 대신 “지역별 창업 업종 수”, “연령대별 고용률”, “자격증 응시자 통계”처럼 목적이 드러나는 검색어를 넣는 것이 좋다. 검색 결과 화면에서는 데이터 제공 기관, 업데이트 날짜, 파일 형식, 제공 방식이 함께 표시된다. 여기서 특히 업데이트 날짜를 꼭 확인해야 한다. 오래된 데이터는 현재 상황과 다를 수 있기 때문이다.

데이터 제공 방식은 크게 파일 다운로드형과 API형으로 나뉜다. 처음 시작하는 사람은 반드시 파일 다운로드형부터 선택하는 것이 좋다. 엑셀이나 CSV 형태로 바로 열어볼 수 있기 때문이다. 데이터 상세 페이지에 들어가면 “다운로드” 또는 “활용 신청” 버튼이 있다. 즉시 다운로드 가능한 자료도 있고, 간단한 활용 목적을 적고 승인받는 자료도 있다. 승인형이라고 해서 부담 가질 필요는 없다. 대부분 자동 승인되거나 빠르게 처리된다.

파일 형식이 CSV인 경우 엑셀에서 바로 열 수 있다. 엑셀 실행 후 열기 메뉴에서 파일을 선택하면 자동으로 표 형태로 불러와진다. 간혹 한글이 깨져 보일 수 있는데, 이 경우 가져오기 옵션에서 인코딩 형식을 UTF-8로 선택하면 정상 표시된다. 다운로드 단계에서 중요한 것은 파일명과 설명 문서를 함께 저장하는 것이다. 데이터 정의서나 항목 설명 파일이 따로 제공되는 경우가 많은데, 이것이 있어야 각 열이 무엇을 의미하는지 정확히 이해할 수 있다.

이 단계까지가 전체 과정의 절반이다. 많은 사람들이 여기서 멈추지만, 사실 진짜 가치는 이제부터 시작이다. 데이터를 열어보고 구조를 이해하는 순간부터 분석과 콘텐츠 아이디어가 나오기 시작한다.

엑셀에서 데이터 정리하는 방법 — 분석 전에 반드시 해야 할 작업

공공데이터를 엑셀로 열면 숫자와 항목이 매우 많아 보일 수 있다. 처음 보면 “이걸 어떻게 분석하지?”라는 생각이 먼저 든다. 하지만 바로 분석하려 하지 말고 먼저 정리부터 해야 한다. 데이터 분석의 70%는 정리 단계에서 결정된다고 해도 과장이 아니다. 정리가 잘 되면 분석은 자연스럽게 따라온다.

가장 먼저 해야 할 일은 제목 행과 항목명을 확인하는 것이다. 각 열이 무엇을 의미하는지 이해해야 한다. 단위도 반드시 확인해야 한다. 천 단위인지, 퍼센트인지, 연간 수치인지 분기 수치인지에 따라 해석이 완전히 달라진다. 데이터 설명서가 함께 제공된다면 반드시 먼저 읽어보는 것이 좋다. 이 과정을 건너뛰면 잘못된 해석을 하게 된다.

다음 단계는 불필요한 열과 행을 정리하는 것이다. 분석 목적과 관련 없는 항목은 과감히 삭제하거나 숨긴다. 예를 들어 지역별 업종 분석이 목적이라면 코드값, 내부 관리 번호 같은 열은 제거해도 된다. 이렇게 해야 화면이 단순해지고 핵심이 보인다. 또한 빈칸이 많은 행이나 합계 행이 중간에 섞여 있는 경우도 정리해야 한다. 합계는 따로 계산할 수 있으므로 원자료는 개별 데이터 중심으로 유지하는 것이 좋다.

그 다음은 필터 기능을 사용하는 것이다. 엑셀 상단의 필터 기능을 켜면 특정 연도, 특정 지역, 특정 항목만 골라 볼 수 있다. 초보자에게 필터는 가장 강력한 분석 도구다. 복잡한 함수 없이도 원하는 조건만 추려낼 수 있기 때문이다. 예를 들어 최근 3년 데이터만 보고 싶다면 연도 열에서 해당 값만 체크하면 된다.

데이터 형식도 점검해야 한다. 숫자가 문자로 저장되어 있으면 합계나 평균 계산이 되지 않는다. 셀 정렬이 왼쪽으로 붙어 있다면 문자일 가능성이 있다. 이 경우 숫자 형식으로 변환해야 한다. 쉼표 제거, 공백 제거, 단위 통일도 중요하다. 이런 기초 정리 작업이 끝나야 이후 계산과 그래프가 정확하게 나온다.

정리 단계에서 추천하는 방법은 “분석용 시트”를 따로 만드는 것이다. 원본 시트는 그대로 두고, 복사본에서 정리와 가공을 진행한다. 이렇게 하면 실수해도 원자료를 보존할 수 있다. 이 습관은 장기적으로 매우 큰 도움이 된다.

 초보자도 할 수 있는 엑셀 기본 분석 — 표와 그래프로 인사이트 만들기

데이터 정리가 끝났다면 이제 본격적인 분석 단계로 넘어간다. 하지만 거창한 통계 기법이 필요한 것은 아니다. 블로그 콘텐츠에 활용할 수준의 분석은 엑셀 기본 기능만으로 충분하다. 핵심은 비교와 변화 추이를 보여주는 것이다. 독자는 복잡한 수식보다 “무엇이 늘었고 무엇이 줄었는지”를 알고 싶어 한다.

가장 먼저 사용할 수 있는 기능은 합계와 평균 계산이다. 엑셀의 자동합계 기능을 이용하면 특정 지역 총합, 연도별 합계 등을 바로 구할 수 있다. 다음으로 유용한 것은 정렬 기능이다. 값을 기준으로 내림차순 정렬을 하면 상위 지역, 상위 업종이 바로 드러난다. 이것만으로도 “상위 5개 지역”, “증가율 높은 항목” 같은 콘텐츠 소재가 만들어진다.

그 다음 단계는 피벗테이블이다. 초보자에게도 매우 강력한 도구다. 메뉴에서 피벗테이블을 선택하고 기준 항목과 값 항목을 드래그하면 요약표가 자동으로 만들어진다. 예를 들어 행에는 지역, 열에는 연도, 값에는 사업체 수를 넣으면 지역별 연도 변화표가 즉시 완성된다. 복잡한 수식 없이 구조화된 요약이 가능하다.

그래프는 반드시 활용하는 것이 좋다. 숫자 표보다 그래프가 이해 속도가 훨씬 빠르다. 꺾은선 그래프는 추세를 보여줄 때 좋고, 막대 그래프는 비교에 좋다. 그래프를 만들 때는 항목을 너무 많이 넣지 말고 핵심 5~7개만 선택하는 것이 가독성이 높다. 제목도 구체적으로 작성해야 한다. “그래프1”이 아니라 “최근 5년 지역별 창업 업종 증가 추이”처럼 쓰는 것이 좋다.

마지막으로 중요한 것은 해석 문장을 함께 쓰는 것이다. 그래프만 보여주면 독자는 판단해야 할 부담이 생긴다. 대신 “이 수치가 의미하는 것은 무엇인지”를 2~3문장으로 설명해야 한다. 예를 들어 “A업종은 전체 증가율보다 두 배 빠르게 늘고 있어 지역 수요 확대 가능성이 있다”처럼 해석을 붙이면 분석 콘텐츠가 된다.

이 과정을 한 번만 해보면 다음부터는 훨씬 빨라진다. 공공데이터 다운로드 → 엑셀 정리 → 요약 → 그래프 → 해석의 흐름이 반복되면서 자신만의 데이터 기반 콘텐츠 제작 방식이 만들어진다. 그리고 이것이 다른 블로그와 차별화되는 가장 강력한 경쟁력이 된다.