포스트

Snowflake 해커톤2026 후기

미국의 클라우드 데이터 기업 Snowflake에서 주최한 해커톤에 참가하였다. AI tool 기업으로 변모하고자 요즘 시대에 맞게 플랫폼을 ai 트렌디하게 변경한 걸 알 수 있었다. 해커톤을 통해 Snowflake의 새로운 플랫폼을 널리 알리고 좋은 usecase를 선별하고자 하는 듯 했다. —

대회 소개

https://www.snowflake.com/snowflake-hackathon-2026-korea/

![[Pasted image 20260418095441.png]] ![[Pasted image 20260418095633.png]]

  • 나는 3월 25일 유저그룹 두번째 밋업에 참가했고 과제 진행은 4월 중 대략 하루 이틀 정도를 풀로 사용하여 이용하여 진행했다.

    제공데이터

  • 데이터는 크게 주식, 부동산, 자산 및 카드 내역, 렌탈 및 계약 데이터가 있었다.
    • 넥스트레이드, 리치고, SPH, 아정당에서 각 데이터를 제공했다.

문제 정의 (대회 목표)

![[Pasted image 20260418103128.png]]

  • 데이터를 분석해가설을 세우고 그에 따른 insight를 도출하거나 사업성 있는 현실적인 결과를 만들면 좋은 점수를 주는 듯 했다.

유저그룹 밋업 #2 후기

![[Pasted image 20260418102009.png]]

snowflake 2026 해커톤을 진행하기 전 오프라인 유저밋업 이벤트로 저는 퇴근 후 선릉에 다녀왔습니다.

데이터에 강점을 갖는 snowflake가 ai 툴로 변모하기 위해 최신 트렌드의 옷을 입은 느낌이 인상적이었습니다.

연사분께서 “손쉽게”라는 말을 굉장히 자주 하셨는데 크게 와닿지는 않아서 직접 해커톤을 진행하며 경험해 봐야 알겠다고 느꼈습니다.

그래도 쿼리로 모델을 불러 처리하는 aisql은 흥미롭게 보았습니다.

![[Pasted image 20260418102009.png]]

![[Pasted image 20260418102017.png]]

![[Pasted image 20260418102022.png]]

  • 데이터 기업인만큼 SQL로 대부분의 요구사항을 해결하는데, 쿼리 안에 AISQL이라는 약속어로 ML 모델들을 호출할 수 있다.
    • ex1) 분류 모델로 분류한 결과로 새로운 컬럼을 만든다.
    • ex2) 비정형 데이터인 이미지 컬럼을 분류해 row들을 select한다.

내가 진행한 과제

  • 나는 “서울 3구 법정동 젠트리피케이션 정도 분석” 이라는 주제로 진행했다.
  • 사용한 데이터
    • 리치고 - 부동산 데이터
    • SPH - 자산 소득 및 카드 소비 내역
    • 공공 데이터 - 상권 분석 서비스 - 세부 업종 개폐업 활용
  • 가설
      1. 고급화 업종(카페, 양식, 피부관리 등)의 비중 증가와 저가 업종 (호프, PC방, 노래방 등) 감소가 동시에 나타나는 지역은 젠트리피케이션 진행 중이다.
      1. 프렌차이즈 침투율 상승은 자본 유입의 신호이며, 기존 자영업 폐업률 상승과 동행한다.
      1. 고소득 인구 유입과 소형 아파트 비율 변화는 젠트리피케이션 인구학적 선행 지표이다.
      1. 12분기 젠트리피케이션 스코어 시계열 패턴을 기반으로 다음 4분기 변화 방향과 속도를 예측할 수 있다.
  • Gentrification score = 고급화지수 변화량 * 0.4 + 고소득자비율 변화 * 0.3 + 소형평형비율

![[Pasted image 20260418103947.png]]

  • streamlit으로 구성한 결과물
    • ![[Pasted image 20260418104211.png]]
  • snowflake가 streamlit을 인수했다는데 이렇게 쉽게 사용하려는 목적으로 보인다

후기

  • 결론부터 말하면 대회를 진행하며 단 한 줄의 코드도 직접 작성하지 않았다. 일부로 그러려고 한 것은 아닌데 Cortex Code라는 대화형 툴로 대화만 하다보니 애플리케이션이 완성됐다.
  • 이는 IDE에 붙어 copilot 처럼 코드를 대신 작성해주는 툴을 이용했던 경험과는 달랐다. 데이터를 기반으로 대화하고 streamlit으로 보여주는 것. 가설과 의견을 내는 애플리케이션을 프로토타입으로 만들 때 data driven 한 앱을 만드는데 꽤 편리해 보인다.
  • 데이터를 분석해 의견을 나누는 대화
  • 여느 ai 툴처럼 가진 코드나 데이터를 태그해 메인 정보로 활용하게할 수 있다.
  • 자체적으로 제공하는 ML 예측 모델들도 SQL에 넣어 사용할 수 있는데 이것도 인상적이었다.
  • 작업 환경과 과정
이 기사는 저작권자의 CC BY 4.0 라이센스를 따릅니다.