상세 컨텐츠

본문 제목

인스타그램 팔로워 분석 1. RPA를 통한 데이터 수집 자동화

RPA-Power Automate/파워오토메이트 데스크탑

by e-커머스분석가 2024. 7. 23. 09:43

본문

반응형

제가 사용하고 있는 RPA 툴은 마이크로소프트의 Power Automate (파워 오토메이트)입니다.
 
이번에는 파워 오토메이트를 사용하여 인스타그램 팔로워 데이터를 수집하는 과정을 설명하겠습니다.
 
 

1. 소셜블레이드 회원가입

 
인스타그램 데이터를 수집하기 위해서, 소셜블레이드라는 웹사이트를 이용합니다.
 
다음 링크로 이동하여 회원가입을 먼저 진행해 주세요👇
https://socialblade.com/
 
소셜블레이드에서는 유튜브, 트위터, 페이스북, 인스타그램 등 다양한 SNS 채널의 데이터를 확인할 수 있습니다.

인스타그램 데이터를 검색할 수 있어요
회원가입을 진행해야 데이터를 확인할 수 있습니다.

 

2. 소셜블레이드 수집 데이터 확인

 
저장할 정보는 다음 이미지의 검색 창에 인스타그램 계정을 검색하면 확인할 수 있습니다.

 
예시로 삼성전자의 계정을 조회했을 때 화면입니다.👇

업로드 숫자, 팔로워 숫자, 팔로우 숫자, 참여율, 평균 좋아요, 평균 코멘트 등의 정보가 있습니다.

데이터의 주의사항은 화면의 ? 물음표를 클릭해서 직접 확인하시기 바랍니다.

빨간색 네모 칸에 있는 정보를 불러와야 합니다.

 

계정의 날짜별 데이터도 제공하고 있으나, 이 포스팅에서는 위 데이터를 사용하지는 않습니다.

 

3. 수집할 계정 리스트가 포함된 엑셀 파일 준비


딱 1개 계정의 팔로워 데이터를 수집할게 아니라면,
수집할 여러 계정이 포함된 리스트를 준비해야 합니다. (몇 개 안 된다면 RPA 내에 저장하셔도 됩니다.)
 
엑셀파일은 최대한 간단하게 구성해도 됩니다.
 
다음 이미지처럼 A1 셀부터 아래로 각 계정의 이름만 쭉 적어두고 엑셀파일을 별도로 저장해 주세요
이렇게 만든 파일은 다음 RPA 작업 시에 변수로 불러올 예정입니다.

 
 

4. 파워오토메이트 RPA 작업

파워오토메이트 데스크탑은 다음 링크에서 무료로 다운로드하여 사용할 수 있습니다.
https://learn.microsoft.com/ko-kr/power-automate/desktop-flows/install
 
📍파워오토메이트 웹 버전은 평가판 기간을 제공하니, 데스크탑 버전을 몇 번 사용해 보시고 궁금하다면 웹버전 평가판을 사용해 보시길 추천합니다.
 
 

우선 파워오토메이트의 홈에서 새 흐름을 클릭하여, 새로운 흐름을 만들어주세요

 
 
파워오토메이트에서는 다음 이미지처럼 3단계로 작업합니다.

 
1. 소셜블레이드 웹 브라우저 오픈
2. 인스타그램 각 계정 검색 및 데이터 저장
3. 웹 브라우저 종료
 
따라서 상단 메뉴에서 하위흐름 -> 새 하위흐름을 클릭하여 3개의 하위 흐름을 먼저 만들어줍니다.

 
그리고 왼쪽 작업영역의 흐름제어 부분에서 하위 흐름 실행을 가져온 다음 

 
각각의 하위흐름 영역을 배정해 줍니다.

 
 

 

 

하위흐름 1. 소셜블레이드 오픈


왼쪽 작업영역에서 브라우저 자동화 항목에 있는 새 chrome 시작을 가져와서 소셜블레이드 url을 넣어주고 browser로 저장합니다.
 
대부분 브라우저 작업은 다음 이미지의 항목들로 수행됩니다.

⚠️여기서 크롬이나 엣지 둘 중 하나를 선택해서 사용하면 됩니다.
저는 엣지를 사용했을 때, RPA 업데이트를 하면 오류가 발생했던 경험이 있어서, 크롬으로 사용하고 있습니다. 업데이트 오류는 현저히 줄었습니다.

 
 
그다음 로그인 화면으로 이동하여, 각 로그인 화면 창의 email과 패스워드를 각각 입력하고 로그인 버튼을 누르도록 작업해 줍니다.
 

 

UI 요소 선택기
파워오토메이트에서 웹 브라우저 요소를 클릭할 때에는,
ctrl 버튼을 누르고 지정하고자 하는 브라우저 영역을 지정해주면 됩니다.

 
 

하위흐름 2. 인스타그램검색

 

 
 
먼저 오늘 날짜를 가져와서 다운로드한 파일에 날짜를 배정해야 하기에 오늘날짜 가져오기 하위흐름을 만들어주었습니다.
 
하위흐름 오늘날짜 가져오기는 하위 흐름 밑에 다음과 같이 생성합니다.
 
오늘 날짜를 가져와서 CurrentDateTime으로 저장하고, 저장한 날짜를 yyyy-mm-dd 간단한 형식으로 변환하여 텍스트로 저장합니다.

 

 
그다음 위에서 저장해 두었던 엑셀파일 ( 수집할 계정정보 )를 열어 계정 리스트를 가져와야 합니다.
 
여기서는 작업 엑셀 부분에서 EXCEL 시작을 사용합니다.

엑셀 열고 닫고 셀 수정, 시트 데이터 가져오기 등의 작업이 가능합니다.
엑셀의 경로를 지정해서 열게합니다.

 
 
그다음 엑셀 시트를 읽게 하고 변수로 저장을 한 후, 엑셀을 닫아줍니다.

엑셀 시트의 내용을 변수로 불러옵니다.

 
 
여기까지 수집할 계정 리스트를 엑셀파일을 열고 가져왔습니다.
 
이다음에는 각 계정 리스트를 가지고 소셜블레이드 페이지를 조회해야 합니다.

다음 이미지의 각각의 경우는 코딩의 for each 부분과 비슷합니다.
 각 데이터를 한 번씩 돌아가며 하위 작업을 실행합니다.

각 계정별로 소셜블레이드 페이지를 1번씩 조회하고 데이터를 엑셀에 저장하도록 설정하겠습니다.

모자이크 부분은 오류를 줄이기 위한 예외처리 등을 설정한 부분입니다. 설정하지 않아도 큰 흐름 상 무방합니다.
페이지의 데이터를 추출합니다.
추출한 데이터를 엑셀 파일로 저장합니다.

If 작업을 사용하여, 다음의 작업을 진행합니다.
만약 어떤 계정에 해당되는 폴더가 없을 경우 👉 계정의 폴더를 생성
계정의 폴더가 있을 경우 👉 스킵

여기서 계정은 currentitem변수, 불러왔던 엑셀리스트 중 for each로 돌고 있던 특정 계정을 의미합니다.

그다음 엑셀 파일에 불러온 데이터를 입력하고,
파일명 앞에 날짜 변수를 넣은 뒤, 저장합니다.

여기서 A1셀의 값이 정보를 받아올 때마다 바뀌는 값이어서, 이 부분을 항목이라는 텍스트로 바꾸어주는 작업도 같이 수행합니다.
(열의 이름이 데이터마다 다르면 데이터 불러올 때, 하나의 열이 아닌 여러 개의 열로 인식합니다.)

A1셀과 C5번 셀을 조정하기 위한 작업이 필요하다. C5는 추후 쿼리 단계에서 수정하면 된다.

하위흐름 3. 소셜블레이드 종료

데이터를 저장했으니 로그아웃을 하고 브라우저를 닫아야 한다.
이 부분이 제대로 수행되지 않을 경우, 다음 RPA실행할 때, 로그인 오류가 날 수 있다. (이런 경우를 대비한 여러 가지 장치들이 필요하다.)

 

5.RPA실행해 보고 오류 수정하기


이제 상단의 실행 버튼을 눌러보고 RPA가 정상 동작하는지 확인해 봅시다.

정상적으로 동작한다면 다음 화면처럼 각각의 폴더와 파일이 생성되어야 합니다.

생성된 각 폴더
생성된 각 엑셀 파일

 

 

✨여기까지 5단계 중 1단계가 끝났습니다.

 

0. 인스타그램 팔로워 분석. INTRO
1. RPA를 통한 데이터 수집 자동화
2. RPA 작업스케쥴러 세팅(정해진 시간에 작업 시작)
3. 저장한 데이터 BI 데이터플로우로 업로드
4. 파워 BI데스크탑에서 BI작업하기
5. 게시 및 업데이트 설정하기

이 다음에는 방금 설정한 RPA를 특정 시간에 작동하게 하는 작업스케쥴러에 대해 알아보겠습니다.

 

 

 

✨인스타그램 팔로워 분석에 대한 전체 개요는 다음 링크에서 확인해보세요
https://catching-data.tistory.com/2

 

인스타그램 팔로워 분석 0. INTRO

인스타그램 팔로우 데이터를 수집하고,수집한 데이터를 대시보드로 제작하는 작업을 진행해봅니다. 이 과정은 데이터 수집부터 구현된 대시보드까지 전 과정 자동화하여 구현하는 것을 목표

catching-data.tistory.com

 

관련글 더보기