ADSP 필기 시험 준비 요약본 (필수 정리)
안녕하세요. JohnComputer입니다. 이번에 컴퓨터를 교체하기 위해서 자료를 이동중에 있는데요. 이전에 공부하던 자료들이 조금 남아서 공유차원에서 올려 두려고 이렇게 글을 씁니다. 시험에 나오는 필수 내용들을 시험전에 출력해서 바로 보고 시험치러 들어가려고 따로 정리해둔 파일들입니다. ADSP 준비 필기 (필수 암기) 1장 1. 특성 1. 존재적 특성 : 객관적 사실 (FACT 기반) 2. 당위적 특성 : 추론, 예측 ( 기대에 의한 추정 ) 2. 유형 구분 형태 특징 정성적 데이터 언어, 문자 등 비정형 데이터, 통계분석 어려움 정량적 데이터 수치, 도형, 기호 등 객관석이고 통계분석이 용이 3. 지식경영 핵심 이슈 구분 의미 예 특징 상호작용 암묵지 학습과 경험을 통해 내면적으로 갖고있는 지식 ..
2023.03.04
no image
대구 중구 - 군위식당 ( 성시경 국밥 )
안녕하세요. JohnCom입니다. 오늘은 그토록.. 여자친구가 가고 싶어했던 군위 식당에 가게 되었습니다. 성시경이 방문하고 많은 인파로 웨이팅이 있는 곳이죠. 저는 차를 끌고 가서 소주는 못먹었지만 술먹기에 딱 좋은 곳이 였습니다. 성시경에 먹을텐데~ 방송에 나왔어요 대구에 살면서 정말 맛있는 국밥집을 많이 다녀보았는데요. 제가 생각했을때 가장 맛있던 국밥집 2~3위 정도 하는 것 같습니다. 사실... 마음속 1위는 신마산국밥... 너무 유명하죠? 토요일 3시쯤 방문했는데 사람들이 줄서 계셨고요. 국밥집이 양쪽으로 있어서 대기줄은 생각보다 빨리 빠졌습니다. 저기 왼쪽 하고 오른쪽 이렇게 있습니다. 아 혹시! 방문하실때 못찾을 수 있어서 꿀팁 하나 설명드리면 저기 !! 이미지에 있는 저기 길로 중앙상가 ..
2022.12.11
no image
대구 수성구 - 충무로 양곱창
안녕하세요. JohnCom 입니다. 계속 사진첩에 담아두고 올리지 못한 맛집을 오늘 계속해서 올리는데요. 이번에 가게된 양곱창 집을 소개해드리려고 합니다. 로드뷰를 먼저 보면 사진 처럼 주차장이 넓게 되어 있어서 주차 걱정은 안하셔도 될것 같아요 주차장이 꽉 차면 중간에 주차를 하고 사장님한테 이야기하시면 알아서 발렛 해주십니다. 기본찬 세팅은 이렇게 나오고요 나오자마자 배고파서 후다닥 먹다보니 조금 비워져 있어요 ;;; ㅎㅎ 이곳의 양곱창 보다 더 맛있는건 저기 저 동치미 국물입니다. 정말 맛있어요. 노릇노릇 불판위에 구어지는 중입니다. 아 굽는것에 대해 두려움이 있어도 괜찮습니다. 사장님이 오셔서 구워주실거에요. 숯불에 굽다 보니 더욱 맛있습니다. 양대창 특성상 불나는 것 조심 또 조심해주세요. 보니..
2022.12.11
no image
남대문시장 갈치골목 - 전주식당
안녕하세요. johnCom 입니다. 오늘은 남대문시장 갈치골목을 방문했는데요. TV에서도 많이 방문한 곳으로 골목 골목 붙어 있는 갈치 골목을 다녀왔어요. 여긴 한국분들도 많지만 외국분들이 정말 많이 찾는 거리인것 같습니다. 용인, 기흥에서 출발하시는 분들은 5000B(2층버스), 5003번 버스 타고 가시면 되요~ 사람들이 너무 많아서 골목 사진은 찍지 못했고 메뉴 나오는 사진만 작성했습니다. 위치는 남대문 갈치골목에 있는 전주식당입니다. 무한도전, 오늘뭐먹지에 방영 되었다고 사진이 걸려 있고요. https://youtu.be/D6UJ5qjbgLA 황금빛 내 인생 드라마에 나왔었던 집입니다. 위에 유튜브 영상 첨부해두었습니다. 메뉴판 사진을 못찍어서 드라마 캡쳐해서 올리는데요 저기 적혀있는 가격이 모두..
2022.12.11
no image
MySQL 8.0 Community server 설치 ( 윈도우, 64 bit )
안녕하세요 JohnCom입니다. MySQL을 예전부터 사용하다 보니 5.7 버전, 8.0 , Maria DB 까지 모두 로컬에서 혼동되어 사용중입니다. 그래서 이번에 새롭게 설치하면서 블로그에 글을 한번 남겨봐요 중간 중간 생략된 부분은 그냥 NEXT로 넘어가 주시면 되고 혹시 모르겠는 내용이나 오류 발생시 댓글 남겨주세요. 재설치 비밀번호 오류나 PATH설정은 중간에 작성되어 있습니다. 1. 가장 먼저 MySQL 사이트 접속 부터 해주시고요. https://www.mysql.com/downloads/ MySQL :: MySQL Downloads MySQL Cluster CGE MySQL Cluster is a real-time open source transactional database designe..
2022.11.25
no image
python3 설치 부터 경로 설정까지 (pip, python, 환경 변수, path)
안녕하세요. JohnCom 입니다. 오늘은 제 로컬 PC에 Python3 를 설치를 진행하는데 설치하는 방법을 정리해두면 처음 시작하는 분들에게 도움이 될 것 같아서 이렇게 따로 정리해둘려고 글을 씁니다. "pip 인식이 안되요" pip 인식이 안되는 분들은 아래 3. 경로 설정 부분만 보시면 됩니다. 본론으로 바로 들어가서 https://www.python.org/downloads/ Download Python The official home of the Python Programming Language www.python.org 먼저 설치를 위해 해당 페이지에 접속 해줍니다. 1. 사이트 접속 본인의 운영체제에 맞게 설치하면 되는데 저는 현재 글 작성하고 있는 Windows에 설치할것이기 때문에 저기..
2022.11.20
no image
동성로 치킨 맛집 ( 원주 통닭 ) - 원주말고 대구에 있어요
안녕하세요. 전국을 돌아다니며 지내다 보니 항상 지역별 맛집을 찾고자 생각하고 아무생각 없이 들어가보곤 하는데요 이번에 길가다가 우연히 들어가 본 치킨집인데 정말 맛있어서 소개하고자 글을 씁니다. 간판은 이렇게 생겼습니다 입구부터가 맛집 냄새가 풀풀 풍겨서 안들어 갈 수 가 없겠더라고요 위치는 위 지도를 참조해서 찾아 가시면 됩니다 ㅎㅎ 골목안에 있어요 저희가 주말 2~3시쯤 방문했는데 저희 말고 딱 1테이블만 있더라고요 한적하니 좋았습니다. 정말 치킨이 맛있는데도 불구하고 사람이 별로 없더라고요. 제 블로그를 보시는 분이 많이 없으니깐 올려도 사람이 몰리지 안을 거라서 그냥 적습니다 저희는 반반 치킨 주문했고요. 보이시는것과 같이 그냥 옛날 치킨같은 비주얼의 치킨과 진짜 무맛이 나는 무가 나와요. 치킨..
2022.11.09
no image
오래된 노트북 리눅스 설치하기 (CentOS)
안녕하세요. Johncom입니다. 계속 AWS를 이용해서 개인 작업을 하다 보니 너무 요금이 많이 나오게 되었습니다.. 달에 20~30은 나오는 것 같네요 ㅠㅠ 그래서 이번에 오래된 노트북(넷북)이 있는데 이걸 가지고 한 번 리눅스를 만들어서 해볼려고 합니다. 기본적으로 컴퓨터에 VM을 띄워서 하는 방법을 주로 하시겠지만 당근마켓만 잘 찾아 보아도 노트북 5~10만원에 구매하실 수 있습니다. 제약 없이 한번 해보는 것도 재밌겠네요. 보시다싶이 정말 작습니다. 너무 작아서 좋은 것 같아요 ㅎㅎ 이제는 보기 힘든 윈도우 7입니다... 사진 찍다가 알게 된건데... 램 1?????? 입니다.??? The CentOS Project DevConf.US Dojo Jun 10, 2022 — CentOS is hos..
2022.09.30
반응형

안녕하세요. JohnComputer입니다.

이번에 컴퓨터를 교체하기 위해서 자료를 이동중에 있는데요.

이전에 공부하던 자료들이 조금 남아서 공유차원에서 올려 두려고 이렇게 글을 씁니다.

시험에 나오는 필수 내용들을 시험전에 출력해서 바로 보고 시험치러 들어가려고 따로 정리해둔 파일들입니다.

 

ADSP 준비 필기 (필수 암기)

1장


1. 특성

1. 존재적 특성 : 객관적 사실 (FACT 기반)

2. 당위적 특성 : 추론, 예측 ( 기대에 의한 추정 )

 

2. 유형

구분 형태 특징
정성적 데이터 언어, 문자 등 비정형 데이터, 통계분석 어려움
정량적 데이터 수치, 도형, 기호 등 객관석이고 통계분석이 용이

 

 

3. 지식경영 핵심 이슈

구분 의미 특징 상호작용
암묵지 학습과 경험을 통해
내면적으로 갖고있는 지식
자전거 타기 다른 사람에게 공유되기 어려움 공통화, 내면화
조직의 지식으로 공통화
형식지 문서나 매뉴얼처럼
보여지는 지식
데이터베이스, 전달과 공유가 용이 표출화, 연결화
개인의 지식으로 연결화

 

4. DIKW

지혜 Wisdom A사이트 보다 B사이트가 다른 물건도 비싸게 팔걸?
지식 Knowledge B사이트보다 가격이 저렴한 A사이트에서 사야겠다
정보 Information B사이트가 A사이트 보다 싸다
데이터 Data A= 2000, B = 1000

 

5. OLTP / OLAP

- OLTP : 컴퓨터가 데이터베이스를 액세스 하고, 바로 처리 결과를 돌려 보내는 형태

(Transaction Processing) 복잡하고 정규적인 데이터를 바로바로 존나 빠름 -> 예측가능

- OLAP : 다차원적인 데이터를 대화식으로 분석하는 기술

(Analytical Processing) 단순한데 분석이니깐 오랜 많은 데이터를 정적으로 천천히 분석 함. -> 예측불가

 

6. 간단 용어

- ERP : 경영자원의 효과적 이용이라는 관점에서 통합적으로 관리하고 경영의 효율을 주는 시스템.

- SCM : 기업이 외부 공급업체 또는 제휴업체와 통합된 정보시스템으로 연계하여 시간과 비용 최적화.

자재구매, 생산, 제고, 유통, 판매, 고객 데이터로 구성된다

- CRM : 고객관계관리. 기업이 고객과 관련된 모든자료 분석 통합 하여 고객 맞춤 서비스 하는 것.

 

1-6 기출문제

1. 다음 중 정성 데이터는?

1) 풍향 2) 습도 3) 기상특보 4) 1시간 강수량

 

2. 다음 중 암묵지와 형식지의 상호작용과 상관 없는 것은?

1) 공통화 2) 내면화 3) 연결화 4) 추상화

 

3. 개인에게 내재된 경험을 객관적인 데이터로 문서나 매체에 저장, 가공, 분석 하는 과정은?

1) 연결화 2) 내면화 3) 표출화 4) 공통화

 

 

기출문제 답 : 3,4,3

 

**빅데이터

1. 빅데이터의 정의

가트너 그룹의 더그래니의 3V

3V : (Volume), 다양성 (Variety), 속도 (Velocity)

+

4V : 가치(Value) / 시각화 (Visualiztion) / 정확성 (Veracity)

 

2. 빅데이터의 기능 비유

산업혁명의 석탄, 제조업 + 서비스분야의 생산성을 획기적으로 끌어올려 혁명적 변화를 가져올것
21세기의 원유 산업 전반의 생산성을 한 단계 향상시키고, 기존에 없던 새로운 범주의 산업 만듦.
렌즈 현미경이 생물학 발전에 미쳤던만큼 데이터가 산업발전에 영향을 미칠것임.
Ngram Viewer (Google)
플랫폼 공동 확용의 목적으로 구축된 유무형의 구조물 서드파티 비즈니스에 활용되면서 플랫폼 역할을 할 것. 카톡 / 페이스북 등 Social Media

 

3. 과거에서 현재로의 변화

과거 현재
사전처리 사후처리
표본조사 전수조사
인관관계 상관관계

4. 빅데이터 활용 기본 테크닉

 

기술 내용 예시
연관규칙학습 상관관계 찾아내는 방법 맥주를 사는 사람은 콜라도 같이 구매하는 경우가 많은가?
유형분석 문서를 분류 하거나 조직을 그룹으로 나눌 때, 특성에 따라 나눌 때 이 사용자는 어떤 특성을 가진 집단에 속하는가?
유전자알고리즘 최적화 요한 문제의 해결책을 자연선택, 돌연변이 등과 같은 메커니즘을 통해 점진적으로 진화 시켜 나가는 방법 최대의 시청률을 얻으려면 어떤 프로그램을 언제 방송해야하는가?
기계학습 훈련 데이터로부터 학습하여 예측하는 방법 NETFLIX
회귀분석 독립변수 조작하여 종속변수가 어떻게 변하는 지를 보면서 두 변인의 관계를 파악할 때 사용 고객의 만족도가 충성도에 어떤 영향을 미치는가?
감정분석 특정 주제에 대해 말하거나 글을 쓴 사람 감정 분석 새로운 환불 정책에 대한 고객평가는?
SNS분석 (Social Media...) 특정인과 다른 사람이 몇촌 정도의 관계인가를 파악할 때 사용하고, 영향력 있는 사람 찾을 때 사용 친분관계가 승진에 어떤 영향을 미치는가?

5. 빅데이터 시대의 위기 요인

- 책임 원칙 훼손 : 범죄 예측 프로그램에 의해 범행을 저지르기 전 체포

- 데이터 오용

- 책임원칙 훼손

- 사생활 침해

-> 사생활 침해 문제를 해결하기 위한 적극적인 보호장치를 강구하는 방법은?

- 개인정보를 사용하는 사람이 직접 책임지는 책임제의 도입.

-> 사생활 침해를 막기 위해 개인정보를 무작위 처리하는 등의 방지 기술은?

- 난수화

 

6. 딥러닝 관련 분석 기법

- LSTM

- RNN

- Autoencoder

 

7. 딥러닝 오플소스와 관련이 있는 것

- Caffe

- Tensorflow

- Theano

 

8. 1차원적인 분석 - 시험출제 중요내용만

산업 일차원적 분석 애플리케이션
금융 서비스 신용점수, 사기탐지, 가격 책정, 트레이딩, 클레임, 고객 수익성
병원 가격 책정, 고객 로열티, 수익 관리
에너지 트레이딩, 공급/수요 예측
정부 사기탐지, 사례관리, 범죄방지, 수익 최적화

 

9. 데이터 사이언티스트/사이언스

: 다양한 방법으로 복잡한 대용량 데이터를 찾고 서로 연결하고 의미있는 정보를 추출함.

: 하드 Skill + 소프트 Skill을 겸비해야함.

- 구성요소

- 분석적영역 : 수학, 확률모델, 머신러닝, 분석학, 패턴 인식과 학습

- IT : 시그널 프로세싱, 프로그래밍, 데이터 엔지니어링, 데이터 웨어하우스 .. 컴퓨터관련

- 비즈니스 분석 : 커뮤니케이션, 스토리텔링, 프리젠테이션

 

10. 데이터 사이언스에 인문학적 사고

- 디버전스 동역학이 작용하는 복잡한 세계화

- 비즈니스 중심이 제품생산에서 체험 경제를 기초로 한 서비스로 이동

- 경제의 논리가 생산에서 최근 패러다임인 시장 창조로 변화

 

11. 간단 용어

데이터 웨어하우스 : 시간성을 가지는 비휘발성 데이터의 집합.

데이터 레이크 : 정제되지 않은 자연스러운 상태의 아주 큰 데이터 세트.

 

2 장


1. 분석대상 What-How 도표

WHAT 무엇
Known Un-Know
HOW
방법
Optimization 최적화 Insight 통찰 Known
Solution 솔루션 Discovery 발견 Un-Known

 

2. 목표 시점 별 분석 기획 방안

과제 중심적인 접근 방식 : 바로 앞에 당면한 과제를 빠르게 해결

Speed & Test / Quick & Win / Problem Solving

장기적인 마스터 플랜 방식 : 지속적인 분석 내재화

Accuracy & Deploy / Long Term View / Problem Definition

 

3. 분석 기획시 고려사항

1) 가용 데이터에 대한 고려

- 관련 데이터의 파악

- 빠짐없이 문제를 도출하고 식별

2) 적절한 활용방안과 유즈케이스 탐색 필요.

- 비즈니스 케이스 확보

3) 장애요소들에 대한 사전 계획 수립

- 이행 저해 요소 관리

- 분석 모형의 안정적 성능 확보

- 조직 역량으로 내재화를 위한 변화 관리

- 비용대비 효과의 적정한 비용

 

종류 정형 데이터 반정형 데이터 비정형 데이터
특징 - 데이터 자체 분석 가능
- RDB 구조의 데이터
- DB로 관리
-데이터 분석은 가능
-해석 불가 메타정보를 활용하여 해석해야함.
-데이터 자체 분석 불가
유형 ERP, CRM, SCM
Demand Forecasts
모바일데이터, 로그데이터 등
기기에서 생성된 데이터
Competitor Pricing
음성, 영상, 문자
Email Records0

 

4. 분석 방법론

- 절차 / 방법 / 도구와 기법 / 템플릿과 산출물

 

5. 합리적 의사결정을 가로막는 장애요소 :

고정관념 / 편향된 생각 / 프레이밍 효과

 

6. 방법론에 따른 모델

1) 폭포수 모델 : 대표적인 하향식 모델, 단계를 순차적으로 진행하는 방법, 이전단계가 완료되어야 넘어감.

2) 프로토타입 모델 : 일부분을 우선 개발하여 시범 사용 후 요구를 받아 개선 작업을 시작함.

3) 나선형 모델 : 반복을 통해 점증적으로 개발하는 방법, 복잡도가 상승한다는 단점이 있음.

7. 방법론의 구성

 

단계 단계별 산출물 생성 각 단계는 기준선으로 설정되어 관리 된다.
테스크 단계를 구성하는 단위 활동 물리적 or 논리적 단위 / 품질검토의 항목
스탭 WBS의 워크 패키지에 해당되고, 입력자료, 처리 및 도구, 출력자료로 구성 되어짐.

 

8. KDD 와 CRISP-DM

KDD CRISP-DM
분석대상 비즈니스 이해 업무 이해 ( 데이터 마이닝 목표 설정 )
데이터셋 선택 (목표데이터 구성, 비즈니스 도메인) 데이터의 이해 (초기 데이터 수집, 데이터 탐색 )
데이터 전처리 (잡음,이상치,결측치 식별)
데이터 변환
(데이터 차원 축소, 학습용 검증용 데이터 분리 )
데이터 준비 ( 데이터셋 선택, 데이터 정제 )
데이터 마이닝
(기법 선택, 전처리와 변환프로세스 추가 실행 최적 결과 산출 )
모델링 (모델링 기법 선택, 모델 테스트 계획 설계, 모델 평가 )
데이터 마이닝 결과 평가 평가
데이터 마이닝 활용 전개

 

** 연관 문제 **

CRISP-DM 방법론의 모델링 단계에서 수행하는 Task 는 무엇인가?

- 모델링 기법 선택

- 모델 테스트 계획 설계

- 모델 작성

- 모델 평가

 

9. 빅데이터 분석 방법론 - 5단계

 

분석 기획 -> 데이터준비 -> 데이터 분석 -> 시스템 구현 -> 평가 및 전개

가장 많은 피드백 이동

 

10. 비즈니스 모델 기반 문제 탐색

- 업무

- 제품

- 고객

- 규제와 감사

- 지원 인프라

 

11. 비즈니스 모델 분석 기회 발굴의 범위 확장

거시적 관점 사회, 기술, 경제, 환경, 정치 (STEEP)으로 외우자
경쟁자 확대 대체제, 경쟁자, 신규진입자
시장니즈 탐색 고객, 채널, 영향자들
역량의 재해석 내부역량, 파트너 네트워크

 

** 연관문제

비즈니스 모델 캔버스의 채널에 대한 기능은?

-> 판매하는 영역, 고객에게 전달하는 경로등을 가지고 있다. AS는 미포함.

12. 분석 과제 관리를 위한 5가지 주요 영역

Data Complexity 잘 적용될 수 있는 분석 모델의 선정
Speed 분석 모델의 성능 및 속도를 고려한 개발
Analytic Complexity 해석이 가능하며 정확도를 올릴 수 있는 최적모델
Accuracy & Precision 실제 값 사이의 차이의 정확도, 편차의 수준 일관성
Data Size 분석하고자 하는 데이터의 양

 

13. 마스터 플랜 수립 프레임 워크

1) 우선순위 고려 요소

- 전략정 중요도

- 비즈니스 성과 / ROI

- 실행 용이성

 

2) 적용 범위 / 방식 고려요소

- 업무 내재화 적용 수준

- 분석 데이터 적용 수준

- 기술 적용 수준

 

14. ROI 관점에서 빅데이터의 핵심 특징

- 크기 / 다양성 / 속도 -> 투자비용 요소 (3V)

- Value 가치 -> 비즈니스 효과 (4V)

 

15. 거버넌스 체계

: 단순히 대용량 데이터 수집이 아닌 어떤 목적으로 어떻게 데이터를 활용할 것인가를 정하고 방향을 잡는 것.

구성요소

- Process / System / Data / Human Resource / Organization

 

16. 데이터 분석 수준진단

분석 분비도

- 분석업무 / 분석 인력,조직 / 분석기법 / 분석 데이터 / 분석 문화 / 분석 인프라

분석 성숙도

- 도입 / 활용 / 확산 / 최적화

 

17. 데이터 거버넌스 구성요소

- 원칙 : 게이터 유지관리 지침 가이드 / 보안,품질 기준, 변경 관리

- 조직 : 데이터를 관리할 조직의 역할과 책임 / DBA, DA, 데이터 아키텍트

- 프로세스 : 데이터 관리를 위한 활동과 체계 / 작업절차, 모니터링, 측정 활동

 

18. 데이터 거버넌스 체계

- 데이터 표준화 / 데이터 관리 체계 / 데이터 저장소 관리 / 표준화 활동

 

3장


 

1.데이터 처리

- DW, DM의 데이터를 가져와 분석에 활용한다.

- ODS는 정제된 데이터이다.

- 어디서든 데이터를 가져와 활용할 수 있지만 가급적 ODS에서 데이터 전처리 후 DW, DM과 결합하여 사용.

 

2. 시각화

- 시각화는 가장 낮은 분석

- 복잡한 분석보다도 더 효율적 (보이기 때문)

- 빅데이터 분석에서 필수

- SNA분석에 활용 (발전된 형태)

- 텍스트 마이닝에서의 워드 클라우드를 통한 그래프화 (발전된 형태)

- polygon, heatmap, mosaic graph 등의 그래프 작업 (발전된 형태)

 

** 공간 분석 = Spatial Analysis = GIS

 

3. 탐색적 자료 분석 (EDA)

- 점차적의로 특이한 점이나 의미있는 데이터를 도출하고 분석하여 줄여 나가는 것.

- 구조적 관계를 알아내기 위한 기법들의 통칭.

 

4. EDA4가지 주제

- 저항성의 강조, 잔차 계산, 자료변수의 재표현, 그래프를 통한 현시성

 

5. 통계분석

- 기술통계 : 표본이 가지고 있는 정보를 쉽게 파악하기 위해 숫자 or 그래프로 표현하는 절차.

- 추측(추론)통계 : 표본의 표본 통계량으로부터 모집단의 모수에 관해 통계적으로 추론하는 절차.

 

6. 데이터마이닝

- 대용양의 자료로부터 정보를 요악하고 미래에 대한 예측을 목표로 자료에서 관계, 패턴, 규칙등을 탐색하고

모형화 함으로써 유용한 지식을 추출하는 분석방법

- 데이터에 있는 패턴을 파악해 예측하는 분석으로 데이터가 크고 정보가 다양할수록 보다 활용하기 유리한 분석

 

7. 데이터마이닝의 방법론

- 데이터베이스에서의 지식탐색

- 기계학습

- 패턴인식

 

** 관련 문제

1. 데이터 마이닝 모델링에 대한 설명.

- 데이터마이닝 모델링은 통계적 모델링이 아니므로 지나치게 통계적 가설이나 유의성에 집착하지 말자.

- 굳이 다양한 옵션을 줘서 도출할 필요는 없다.

- 분석데이터를 학습 및 테스트 데이터로 6:4, 7:3, 8:2 비율로 상황에 맞게 실시한다.

- 훈련 및 테스트 성능에 큰 편차가 없으면서 예상 성능을 만족한다면 중단한다.

 

2. 모델링 성능을 평가함에 있어, 데이터 마이닝에서 활용하는 평가 기준

- 정확성 / 정밀도 / 리프트 / 디텍트 레이트 / 리프트

3. 시물레이션 활용 평가 기준

- Throughput, Average Waiting Time, Average Queue Length, Time in system 등의 지표 활용

 

4장


4- 데이터마트

 

1.요약변수

- 고객 + 상품 + 채널 종합

- 분석에 맞게 종합한 변수

- 데이터 분석을 위해 만들어진 변수

- 재활용성이 높음.

- 기준갑의 의미해석이 애매할 수 있다.

 

2.파생변수

- 매우 주관적

- 논리적 타당성이 뒷받쳐 줘야 함.

- 세분화, 고객행동 예측, 캠페인 반응 예측에 잘 활용되어짐.

 

reshape : 변수를 조합해 요약 변후와 파생변수를 쉽게 생성하여 데이터 마트르 구성할 수 있는 패키지

- melt () / cast() 핵심 함수 존재.

- melt() -> 원테이터 형태로 만드는 함수.

- cast() -> 요약 형태로 만드는 함수.

 

cast 이용 방법 -> cast(df, 칼럼명 [+] 칼럼명 [~] 값이될칼럼명 )

melt 이용 방법 -> melt(df, id = c("기준칼럼명“,”기준칼럼명2“, 조건) -> 조건은 na.rm=TRUE - 결측값제외

 

ddply : d(데이터) -> d(데이터프레임)

사용법 -> ddply(df(), ~칼럼명, 요약방법(summarize), groupmean=mean(그룹기준))

 

3. 결측값

- is.na : 결측값이 NA인지 여부를 판단하여 반환하는 함수

- knnImputation() : NA값을 K 최근 이웃 분류 알고리즘을 사용하여 대치하는 함수 k개 주변 이웃까지의 거리 고려 가중 평균한 값을 대치해 주는 함수

- rfImpute() : 랜덤 포레스트 모형은 결측값이 있으면 에러발생 -> 랜덤 포레스트 패키지에서 NA결측값 대치하는 함수

 

4. 이상값

- 의도치 않은 값

- 목적과 부합하지 않는 값

- 그냥 이상하게 입력된 값.

** 의미있는 이상값은 제거하지 않는다.

* 이상값 인식 방법

- ESD : 평균으로 3 표준편차 이상 떨어진 값.

* 극단값 절단 방법

- 기하평균을 이용한 제거

- 10% 절단 ( 상,하위 5%값 제거 ) - 데이터 손신율 때문에 잘 이용안함.

- 극단값 조정 : 상한값 하한값 벗어난 값들을 하한, 상한값으로 바꾸어 활용.

 

ADSP -2장.hwp
0.03MB
ADSP -3장.hwp
0.14MB
ADSP - 4장.hwp
0.03MB
ADSP -1장.hwp
0.02MB

반응형
반응형

안녕하세요.

JohnCom입니다.

 

오늘은 그토록.. 여자친구가 가고 싶어했던 군위 식당에 가게 되었습니다.

성시경이 방문하고 많은 인파로 웨이팅이 있는 곳이죠.

저는 차를 끌고 가서 소주는 못먹었지만 술먹기에 딱 좋은 곳이 였습니다.

 

성시경에 먹을텐데~ 방송에 나왔어요

 

대구에 살면서 정말 맛있는 국밥집을 많이 다녀보았는데요.

제가 생각했을때 가장 맛있던 국밥집 2~3위 정도 하는 것 같습니다.

사실... 마음속 1위는 신마산국밥... 너무 유명하죠?

 

토요일 3시쯤 방문했는데 사람들이 줄서 계셨고요.

국밥집이 양쪽으로 있어서 대기줄은 생각보다 빨리 빠졌습니다.

 

저기 왼쪽 하고 오른쪽 이렇게 있습니다.

아 혹시! 방문하실때 못찾을 수 있어서 꿀팁 하나 설명드리면

저기 !! 이미지에 있는 저기 길로 중앙상가 안으로 드러가시면

실내로 편하게 들어가실 수 있어요

쭉~ 들어가시면 줄서있는 가게는 한 곳 뿐이니 바로 찾으실거에요.

 

여기 간판에서 부터 맛집 포스 흘러주시고~

 

가격은 8000원 입니다. 역시 국밥은 가성비 최강입니다.

모든 가격 비교는 국밥으로 비교하는게 경상도 사람들 국룰인거 아시죠?

( 이게 국밥 몇그릇이야~ )

육라면은 손님이 너무 몰릴때는 안되는 것 같습니다 ( 물어보진 않고 옆테이블 엿들었어요 )

 

아주 깔끔한 기본찬 입니다.

저는 양파를 정말 많이 먹어서 양파는 꼭 있어야 합니다.

 

저는 돼지국밥

여자친구는 고기밥 이렇게 주문했고요.

 

보시다싶이 고기가 아주 넉넉하이 들어가 있습니다.

고기밥은 돼지국밥 국물을 어느정도 주십니다.

말아드시지 않는 분들은 고기밥이 더 좋을 수 도 있어요 ㅎㅎ

그리고, ! 밥은 더 필요하면 언제든지 이야기 해달라고 하셨어요 !

 

혹시나 고기밥 시키실 분들은 참고하시라고 고기도 확대해 봐요 ㅎㅎ

 

국밥랭킹 2~3위 등록해두었으니 만경관 갈때 여기는 필수로 들렸다가 가야겠어요 ㅎㅎ

 

+++ 주차는 중앙로 국룰 경상감영공원 아시죠?? 

 

반응형
반응형

안녕하세요.

JohnCom 입니다.

계속 사진첩에 담아두고 올리지 못한 맛집을 오늘 계속해서 올리는데요.

이번에 가게된 양곱창 집을 소개해드리려고 합니다.

 

로드뷰를 먼저 보면

사진 처럼 주차장이 넓게 되어 있어서 주차 걱정은 안하셔도 될것 같아요

주차장이 꽉 차면 중간에 주차를 하고 사장님한테 이야기하시면 알아서 발렛 해주십니다.

 

기본찬 세팅은 이렇게 나오고요

나오자마자 배고파서 후다닥 먹다보니 조금 비워져 있어요 ;;; ㅎㅎ

이곳의 양곱창 보다 더 맛있는건 저기 저 동치미 국물입니다.

정말 맛있어요.

노릇노릇 불판위에 구어지는 중입니다.

아 굽는것에 대해 두려움이 있어도 괜찮습니다.

사장님이 오셔서 구워주실거에요.

숯불에 굽다 보니 더욱 맛있습니다.

양대창 특성상 불나는 것 조심 또 조심해주세요.

 

보니깐 전골 드시는 분들이 계셨는데 저희는 그냥 구이만 시켜서 먹었습니다.

위에서 말씀 드린것 처럼 화력이 쌔니깐 꼭 조심해서 드세요 ㅎㅎ

반응형
반응형

안녕하세요.

johnCom 입니다.

 

오늘은 남대문시장 갈치골목을 방문했는데요.

TV에서도 많이 방문한 곳으로 골목 골목 붙어 있는 갈치 골목을 다녀왔어요.

여긴 한국분들도 많지만 외국분들이 정말 많이 찾는 거리인것 같습니다.

 

용인, 기흥에서 출발하시는 분들은 

5000B(2층버스), 5003번 버스 타고 가시면 되요~

 

사람들이 너무 많아서 골목 사진은 찍지 못했고 메뉴 나오는 사진만 작성했습니다.

 

위치는

남대문 갈치골목에 있는 전주식당입니다.

 

무한도전, 오늘뭐먹지에 방영 되었다고 사진이 걸려 있고요.

https://youtu.be/D6UJ5qjbgLA

황금빛 내 인생 드라마에 나왔었던 집입니다.

위에 유튜브 영상 첨부해두었습니다.

메뉴판 사진을 못찍어서 드라마 캡쳐해서 올리는데요

저기 적혀있는 가격이 모두 옛날 가격이여서 메뉴만 참고해주세요

22.12 월 기준 조림 2인분 24,000 / 모듬 구이 12,000 으로 바뀌었습니다.

 

기본 찬은 딱 여기 보이는 3개의 반찬과 + 계란찜이 나옵니다.

저희는 갈치조림 2인분 + 모듬생선구이1인분 추가했습니다.

갈치 조림 구성은 갈치조림 + 갈치구이 4조각 입니다.

 

 

모듬 구이는 3개의 생선이 나오고요.

(병어, 가자미, 조기) 이렇게 구이가 나옵니다.

 

 

갈치조림 ★★★☆☆

모듬생선구이 ★★★★★

맛있더라고요 ㅎㅎ

 

참고해서 주문하세요~

반응형
반응형

안녕하세요 JohnCom입니다.

MySQL을 예전부터 사용하다 보니

5.7 버전, 8.0 , Maria DB 까지 모두 로컬에서 혼동되어 사용중입니다.

그래서 이번에 새롭게 설치하면서 블로그에 글을 한번 남겨봐요

 

중간 중간 생략된 부분은 그냥 NEXT로 넘어가 주시면 되고

혹시 모르겠는 내용이나 오류 발생시 댓글 남겨주세요.

재설치 비밀번호 오류나 PATH설정은 중간에 작성되어 있습니다.

 

1. 가장 먼저 MySQL 사이트 접속 부터 해주시고요.

https://www.mysql.com/downloads/

 

MySQL :: MySQL Downloads

MySQL Cluster CGE MySQL Cluster is a real-time open source transactional database designed for fast, always-on access to data under high throughput conditions. MySQL Cluster MySQL Cluster Manager Plus, everything in MySQL Enterprise Edition Learn More » C

www.mysql.com

 

2.사이트 화면 하단의 MySQL Community Server 설치 화면으로 이동해주세요.

 

3. MySQL community Server설치

- MySQL community Server를 설치하려면 중간에 있는 Community Server를 선택해서 설치를 진행해도 되지만

 이런경우 Path 설정과 각종 Utility는 개인이 따로 설치를 진행해주셔야 하기 때문에 그냥 바로 MSI파일 내려받기 위해서

 MySQL Installer For Windows로 실행할게요. ( 64 bit 설치도 동일합니다!!! )

 

4. 저흰 No Thanks 합니다 ㅎㅎ

5. 설치 진행

우리 Oracle 형님께서 아주 간단한 질문을 주십니다

리눅스로 따지면 yum Update 같은 거라고 생각하시면 되는데 Yes 해줍니다.

 

6. 선택

아마 제 블로그를 보는 분들이 여러 부류가 계실건데 전문가 분들은 여기 까지 보시고

알아서 세팅을 진행하실 수 있으니

학생, 개발자 관점에서 보면 Developer를 선택하시면 될 것 같습니다.

server, shell, workbench 등등 여러 제품을 포함하고 있습니다.

 

7. Path 설정

따로 설정 안해주셔도 됩니다 ㅎㅎ

 

8. Check List

- 저는 이렇게 설치에 Python이 필요하다는 화면이 뜨고 Manual로 설치해야 한다고 하네요.

Devloper Package에서 필요한것 같기도 하고 잘 모르겠지만 아래 URL들어가서 설치를 진행합니다

이런 화면 이 뜬다면 제 블로그 다른 글

https://johncom.tistory.com/49

 

python3 설치 부터 경로 설정까지 (pip, python, 환경 변수, path)

안녕하세요. JohnCom 입니다. 오늘은 제 로컬 PC에 Python3 를 설치를 진행하는데 설치하는 방법을 정리해두면 처음 시작하는 분들에게 도움이 될 것 같아서 이렇게 따로 정리해둘려고 글을 씁니다. "

johncom.tistory.com

참고해서 설치해주시면 됩니다.

 

간단히 설치 후 Check 눌러주시면 저렇게 초록색 체크박스가 뜹니다.

 

9. Package 설치

- 아래 화면처럼 Package 다운로드 받아야 하는 목록이 뜨게 되고 설치 진행하면 됩니다.

- 필요 없는것도 많이 설치가 되네요.. 그냥 메뉴얼로 할걸 ㅋㅋㅋㅋ Connecter 들을 주르륵 받습니다.

전 파이썬만 있으면 되는뎁..

 

10. Port 설정

- 다른건 모두 넥스트로 넘겨 주시고 이제 가장 중요한 Network 설정입니다.

기본 설정 3306 사용하시면 되고 기존 MySQL 이나 MariaDB가 있다면 다른 Port 이용하셔야 하는데

4060, 3307 마음에 드는 포트 사용하시고 꼭! 기억해두세요.

 

11. Password 설정

- 비밀번호 규칙 설정인데

5.7 이전의 버전과 이후의 버전이 있는데

전 Recommended 버전을 사용하겠습니다.

그냥 1234 같은 비밀번호를 하고 싶은 분들은 아래 선택하시면 됩니다.

 

*혹시 저처럼 재설치 진행 중이시라면 이런 화면을 마주하게 될 수 있고 그런경우

C:/ProgramData 폴더에 MYSQL 을 지워 주셔야 합니다.

 

모두 NEXT NEXT 눌러 주시면 됩니다.

 

12. 설치 확인

- 시작창 -> services.msc 로 mysql80이 잘 실행되는지 확인.

 

 

13. PATH 등록

- 만약 CMD 창을 이용하여 MYSQL 이용을 할 경우 PATH설정을 진행해야 합니다.

C:\Program Files\MySQL\MySQL Server 8.0\bin 와 같은 bin 폴더 등록해주셔야 하고 

 

- Path에서 편집 눌러주시고

두군데 모두 이렇게 PATH 넣어주시면 설치 완료입니다.

반응형
반응형

안녕하세요. JohnCom 입니다.

 

오늘은 제 로컬 PC에 Python3 를 설치를 진행하는데

설치하는 방법을 정리해두면 처음 시작하는 분들에게 도움이 될 것 같아서

이렇게 따로 정리해둘려고 글을 씁니다.

 

"pip 인식이 안되요"

pip 인식이 안되는 분들은 아래 3. 경로 설정 부분만 보시면 됩니다.

 

 

본론으로 바로 들어가서

https://www.python.org/downloads/

 

Download Python

The official home of the Python Programming Language

www.python.org

먼저 설치를 위해 해당 페이지에 접속 해줍니다.

 

1. 사이트 접속

본인의 운영체제에 맞게 설치하면 되는데 저는 현재 글 작성하고 있는

Windows에 설치할것이기 때문에 저기 Windows를 눌러줄게요

 

마찬가지 본인에게 맞는 버전을 고르셔서 설치하시면 되지만

"Stable"버전 -> 안정버전 중 최신버전인 3.11 버전을 설치하시면 됩니다.

새로운 기능을 원하시는 것이 아니라면 화면 왼쪽에서 배포중인 버전 설치하시면 됩니다.

그다음 운영체제 프로세서를 선택해주시면 되는데 혹시 몰라서 아래 본인의 PC정보를 볼 수 있는 내용도 남길게요.

저는 화면에 보이는 64bit 눌러줍니다.

 

2. PC정보

왼쪽 하단 "윈도우 표시" -> 내 pc (띄어쓰기 중요) -> 우클릭 또는 화면의 속성 -> 시스템 종류

이렇게 확인 하시면 됩니다.

 

다시 본론으로 넘어와서

다운로드 받은 파일을 실행해주시고

 

2. 설치 및 환경변수 설정

여기서 부터 중요합니다.

화면 아래에 저기 저 PATH설정을 안해주시면 나중에 세팅을 해야하는데 저 버튼을 누르고 진행해주세요.

전 뒤에 안눌렀을때의 설정 방법 설명해드리려고 안하고 넘어갈게요.

 

아주 SIMPLE하게 설치가 완료되었습니다.

 

시작 창에서 설치된 것을 확인할 수 있습니다.

전.. 뭐 버전이 많습니다 ㅎㅎ

이번에 설치한 버전은 3.11이니깐 확인 해주세요.

 

 

//--------------------------------------------------여기서 부터는 환경 변수 설정입니다.--------------------------------------------//

3. 환경 변수 설정

자 저의 모든 글을 읽지 않고 설치를 진행하면 이런 일이 발생합니다.

cmd 창에서 아무리 python을 외쳐봐도 Microsoft Store 화면이 뜨게 되는데요.

이런 경우 수동으로 PATH 설정 진행 하면 됩니다.

 

오늘 엄청 많이 등장하는 시작 버튼을 눌러 주시고 

"환경 변수" 검색을 합니다.

그리고 시스템 환경 변수 편집을 들어가 주시고

 

 

저기 있는 Path에 대해서 설명해주시는 분들이 없긴 하던데

간단하게 말하면 경로를 설정해줌으로써 컴퓨터에서 저기 폴더에 있는 파일들을 인식 시켜주는것입니다.

예를 들어 c:/programfiles/...../.../파일 이렇게 작성해야 하는 것들을 path등록으로 그런 귀찮음을 없애고

다른 프로그램에서도 python 명령어를 쳤을때 바로 인식할 수 있게끔 등록하는 것이라고 생각하면 될 것 같습니다.

Administrator는 admin 등의 사용자에게 지정하는 것이고

시스템 변수는 시스템 자체의 경로를 설정하는 것으로 아무것도 모르고 둘 중 하나만 했을때도 가능은 하나

시스템 호출이나 사용자 변경이 있을 수 있음으로 둘다 설정해주시면 됩니다.

 

편집으로 넘어가서 새로만들기를 누르고

경로를 입력해주면 되는데 경로 확인은 아래에서 보겠습니다.

시작에서 검색한 Python 의 파일 위치를 열고

만약 보이는 화면처럼 바로가기 아이콘이라면 시작위치를 복사해주신 후 

폴더창에 입력해주세요.

해당 폴더에 python.exe 파일이 있을텐데

저기 해당하는 경로

c:/본인경로/.../.../...       <- Python 인식

c:/본인경로/.../.../.../script    <- Pip 인식

경로 두개를 복사해서 넣어줄 겁니다.

그러고 모두 확인 후 끝나면 cmd 창에서 Python 명령어 인식이 가능합니다.

 

해결하는 도중 모르는 내용이 있으시면 댓글 남겨 주세요 ㅎㅎ

반응형
반응형

안녕하세요.

전국을 돌아다니며 지내다 보니 항상 지역별 맛집을 찾고자 생각하고

아무생각 없이 들어가보곤 하는데요

이번에 길가다가 우연히 들어가 본 치킨집인데 정말 맛있어서 소개하고자 글을 씁니다.

간판은 이렇게 생겼습니다

입구부터가 맛집 냄새가 풀풀 풍겨서 안들어 갈 수 가 없겠더라고요

위치는 위 지도를 참조해서 찾아 가시면 됩니다 ㅎㅎ

골목안에 있어요

 

저희가 주말 2~3시쯤 방문했는데 저희 말고 딱 1테이블만 있더라고요

한적하니 좋았습니다.

정말 치킨이 맛있는데도 불구하고 사람이 별로 없더라고요.

제 블로그를 보시는 분이 많이 없으니깐 올려도 사람이 몰리지 안을 거라서 그냥 적습니다 

저희는 반반 치킨 주문했고요.

보이시는것과 같이 그냥 옛날 치킨같은 비주얼의 치킨과 진짜 무맛이 나는 무가 나와요.

치킨소스는 국룰 깨소금과 같이 나오고

장갑이 필요하신분은 사장님께 여쭤보시면 일회용 장갑도 같이 주십니다.

 

일단 맛을 비유하면 치킨 껍질이 진짜 바삭하면서 속이 부드럽습니다.

세상이렇게 치킨을 잘 튀길수가 없습니다.. (진지)

양념맛은 저는 자극적인걸 좋아해서 엄청 맛있는 정도는 아니였지만

여자친구는 너무 좋아하면서 먹더라고요

정말 맛있습니다.

 

단체로 식사하실 수 있는 룸도 준비되어 있어서 회식장소로도 좋은 것 같습니다.

 

가격이 엄청 착하지는 않는데 맛있으니깐 모든게 용서됩니다.

메뉴판 첨부해요~

반응형
반응형

안녕하세요. Johncom입니다.

계속 AWS를 이용해서 개인 작업을 하다 보니 너무 요금이 많이 나오게 되었습니다..

달에 20~30은 나오는 것 같네요 ㅠㅠ

그래서 이번에 오래된 노트북(넷북)이 있는데 이걸 가지고 한 번 리눅스를 만들어서 해볼려고 합니다.

기본적으로 컴퓨터에 VM을 띄워서 하는 방법을 주로 하시겠지만

당근마켓만 잘 찾아 보아도 노트북 5~10만원에 구매하실 수 있습니다.

제약 없이 한번 해보는 것도 재밌겠네요.

보시다싶이 정말 작습니다.

너무 작아서 좋은 것 같아요 ㅎㅎ

이제는 보기 힘든 윈도우 7입니다...

사진 찍다가 알게 된건데...

램 1??????

입니다.???

 

 

 

 

The CentOS Project

DevConf.US Dojo Jun 10, 2022 — CentOS is hosting an in-person Dojo at DevConf.US. The Dojo will take place at Boston University on August 17, the day before the main DevConf talks. The CFP and registration are open. The Dojo is free as always, but regist

www.centos.org

자 이제 본론으로 들어와서 아래 사이트에 들어가 줍니다.

https://www.centos.org/

 

The CentOS Project

DevConf.US Dojo Jun 10, 2022 — CentOS is hosting an in-person Dojo at DevConf.US. The Dojo will take place at Boston University on August 17, the day before the main DevConf talks. The CFP and registration are open. The Dojo is free as always, but regist

www.centos.org

Download를 눌러 주시고 ->>>>>

여기 아닙니다..

저는 일단 CentOS 7 다운을 받을 거여서 내려가 줍니다...

아래 Older Version에서 -> then click here을 눌러줍니다.

 

여기서 원하는 버전의 mirrors를 눌러줍니다.

-> 저는 넷북 ATOM이여서 i386이미지를 다운로드 받습니다.

atom프로세스를 이용하시는 분은 i386으로 다운 받으셔야 합니다. 8은 지원하지 않아요.

그냥 노트북이신 분들은 기본 파일 받으시면 됩니다.!!

mirror 중에서 저희는 한국인 아닙니까

그리고 tistory에 글을 쓰니깐 kakao 미러를 들어가 줍니다.

 

여기서 원하는 버전 다운로드 해주시면 되는데 저는 그냥 20.09버전 다운로드 받았습니다.~

 

이렇게 완성된 USB를 가지고 설치하러 가봅니다.

 

 

노트북 회사마다 다르긴 하지만 DEL, F2, F10 중 하나이니 일단 연타를 해줍니다.

그러면 BIOS 셋업 창이 뜨게 될텐데 제조사 마다 상이하지만

요런 옵션창에

Boot 옵션 설정 진행해주시면 되겠습니다~

 

USB 설치 디스크로 부팅하게 되면 위와 같은 화면을 마주하게 됩니다.

한국인이니깐 한국어~ 

 

캡처를 위해서

가상 머신에 같이 설치를 해보았는데요.

- 설치 대상 ! 들어 가셔서 파티션 지정을 해주시고 기본 설치된 윈도우가 있다면

포맷도 지원하니 포맷하면서 같이 설치 진행하면 됩니다.

 

그런 다음 설치 시작 버튼 눌러주세요

 

설치는 시작되고

저희에게 위와 같은 시련을 줍니다.

그냥 들어 가서 Root 암호설정과 사용자를 만들어 주세요 ㅎㅎ

아니면 설치 마무리가 안됩니다

 

설치가 완료 되고 나서 위와 같은 화면을 만날 수 있고

아마 처음 설치하시면 저랑 달리 2개의 목록이 뜰텐데 그냥 두시면

알아서 로그인 합니다.

 

Login에 User 또는 root

비밀번호는 아까 앞에서 지정한 비밀번호로 로그인 해주시면

끝입니다. ~!!

반응형