코사장의 코딩 놀이터
반응형

전체 글 75

로지스틱 회귀: 기본 개념 및 분석 방법

1. 로지스틱 회귀란? 로지스틱 회귀는 선형 회귀와 같이 입력 변수와 출력 변수 사이의 관계를 모델링하는데 사용되지만, 출력 변수가 이진 변수인 경우에 사용됩니다. 즉, 출력 변수의 값이 0 또는 1, 참 또는 거짓, 성공 또는 실패와 같은 두 가지 범주 중 하나에 속하는 경우에 로지스틱 회귀를 사용합니다. 로지스틱 회귀는 이진 분류 문제에 적합합니다. 2. 로지스틱 회귀의 원리 로지스틱 회귀는 선형 회귀와 비슷한 방식으로 동작합니다. 다만, 선형 회귀가 입력 변수의 선형 조합을 바로 출력으로 사용하는 반면, 로지스틱 회귀는 입력 변수의 선형 조합을 로지스틱 함수를 통해 변환하여 출력으로 사용합니다. 이 로지스틱 함수는 '시그모이드 함수'라고도 불립니다. import numpy as np import m..

머신러닝 2023.05.11

선형 회귀에 대한 기본 개념 및 그 적용

1. 선형 회귀의 기본 개념 선형 회귀는 데이터를 가장 잘 설명하는 선형 방정식을 찾는 통계학의 방법입니다. 이를 통해 종속 변수와 독립 변수 사이의 관계를 모델링할 수 있습니다. 선형 회귀는 주로 예측, 시계열 분석, 인과 관계 분석 등에 사용됩니다. 2. 선형 회귀의 종류 선형 회귀에는 크게 단일 선형 회귀와 다중 선형 회귀가 있습니다. 2.1 단일 선형 회귀 단일 선형 회귀는 하나의 독립 변수와 하나의 종속 변수 사이의 선형 관계를 모델링합니다. 이는 아래의 방정식으로 표현될 수 있습니다. y = a*x + b 여기서 y는 종속 변수, x는 독립 변수, a는 기울기, b는 y절편을 나타냅니다. 2.2 다중 선형 회귀 다중 선형 회귀는 두 개 이상의 독립 변수와 하나의 종속 변수 사이의 선형 관계를 ..

머신러닝 2023.05.11

Pandas (판다스) 라이브러리 in Python (파이썬)

1. 판다스(Pandas) 소개 판다스(Pandas)는 데이터 분석을 위한 파이썬 라이브러리로, 데이터 조작, 분석 및 시각화를 지원합니다. 판다스는 테이블 형태의 데이터를 처리하기 위해 만들어진 것으로, 간편하게 데이터를 읽고, 수정하고, 분석할 수 있도록 도와줍니다. 이 글에서는 판다스의 기본 개념, 자료형, 예제 및 분석 방법에 대해 소개합니다. 2. 판다스의 주요 자료형 판다스에서는 주로 두 가지 자료형을 사용합니다: 시리즈(Series)와 데이터프레임(DataFrame). 2.1. 시리즈(Series) 시리즈(Series)는 1차원 배열과 같은 자료형으로, 같은 데이터 타입의 값을 가집니다. 시리즈는 인덱스와 값이 함께 저장되며, 인덱스를 이용해 원하는 값에 빠르게 접근할 수 있습니다. impo..

머신러닝 2023.05.09

Python 라이브러리 Numpy 소개

1. Numpy 개요 Numpy는 Numerical Python의 줄임말로, Python에서 과학 계산을 위한 핵심 라이브러리입니다. Numpy는 대규모 다차원 배열 및 행렬 연산을 지원하며, 이러한 배열 연산을 위한 다양한 수학 함수를 제공합니다. Numpy는 데이터 분석, 머신 러닝 및 인공지능과 같은 분야에서 널리 사용되고 있습니다. 2. Numpy의 주요 기능 2.1. 다차원 배열 객체 Numpy의 핵심 기능 중 하나는 n차원 배열 객체인 ndarray를 제공하는 것입니다. ndarray는 동일한 데이터 타입의 원소로 이루어진 배열로, 배열의 크기와 형상을 가지고 있습니다. Numpy 배열은 파이썬의 리스트보다 훨씬 더 효율적으로 메모리를 사용하고, 빠른 연산이 가능합니다. 2.2. 벡터화 연산 ..

머신러닝 2023.05.09

EC2 Ubuntu Puppeteer 크롤링 환경 세팅

이 글은 AWS EC2에서 인스턴스를 생성하여, github에 있는 puppeteer가 포함되어 있는 프로젝트를 pm2를 통해서 돌리기 위한 사전 작업들을 진행 하기 위한 명령어를 순서대로 설명합니다. 1. EC2 인스턴스 생성 (t2.micro 이외에도 여러가지 사용 가능) AWS 가입 및 인스턴스 생성은 잘 되었다고 가정하고 이 부분은 생략. 2. git 설치 및 권한 설정 2.1 ubuntu 내의 소프트웨어를 최신 버전으로 업그레이드 sudo apt-get update 2.2 git 설치 sudo apt-get install git # Ubuntu 2.3 git 설치 확인 (버전 확인) git --version 2.4 git 권한 설정 ssh-keygen -t rsa -C "emai@email.co..

웹개발 2023.05.08

인공지능에서의 비용 함수

1. 비용 함수의 기본 개념 인공지능에서 비용 함수(Cost Function)는 예측 결과와 실제 값 사이의 차이를 측정하는 함수로, 모델의 성능을 평가하는 데 사용됩니다. 비용 함수의 값이 작을수록 모델의 성능이 좋다고 할 수 있으며, 이를 최소화하는 것이 목표입니다. 2.비용 함수의 종류 비용 함수에는 여러 종류가 있습니다. 주로 사용되는 비용 함수는 다음과 같습니다. 2.1. 평균 제곱 오차 (MSE, Mean Squared Error) 평균 제곱 오차는 회귀 문제에서 널리 사용되며, 예측값과 실제 값의 차이를 제곱한 값의 평균입니다. 2.2. 교차 엔트로피 (Cross-Entropy) 교차 엔트로피는 분류 문제에서 주로 사용되며, 예측된 확률 분포와 실제 확률 분포의 차이를 측정합니다. 2.3. ..

머신러닝 2023.05.07

딥러닝 이해하기

1. 딥러닝의 기본 개념 딥러닝은 인공지능(AI)의 한 분야로, 인공신경망(Artificial Neural Network)을 기반으로 하는 머신러닝 기법입니다. 딥러닝은 신경망을 사용하여 데이터의 복잡한 패턴을 자동으로 학습하고, 이를 이용해 분류, 예측, 생성 등의 작업을 수행합니다. 딥러닝은 이미지 인식, 음성 인식, 자연어 처리, 강화 학습 등 다양한 분야에서 높은 성능을 발휘하며, 인공지능 연구와 활용에 큰 영향을 미치고 있습니다. 2. 딥러닝의 종류 2.1. 심층 신경망 (DNN: Deep Neural Network) 심층 신경망은 다수의 은닉층을 포함하는 인공신경망입니다. 이러한 신경망은 복잡한 데이터의 특징을 추출하고, 여러 층을 거치며 점차 더 높은 수준의 특징을 학습합니다. DNN은 이미..

머신러닝 2023.05.05

머신 러닝에서의 비지도 학습 (Unsupervised Learning)

1. 비지도 학습이란? 비지도 학습은 지도 학습과는 달리 학습 데이터에 레이블이 없는 경우에 사용되는 인공지능 학습 방법입니다. 비지도 학습의 목적은 데이터의 숨겨진 패턴이나 구조를 찾는 것이며, 이를 통해 데이터를 이해하고 새로운 지식을 추출할 수 있습니다. 2. 비지도 학습의 종류 비지도 학습에는 주로 클러스터링(Clustering)과 차원 축소(Dimensionality Reduction)라는 두 가지 방법이 있습니다. 2.1. 클러스터링 클러스터링은 데이터를 유사한 특성을 가진 그룹으로 분류하는 과정입니다. 클러스터링의 목적은 데이터의 내재적인 구조를 파악하고, 데이터를 효과적으로 요약하거나 이해하기 위한 목적으로 사용됩니다. 대표적인 클러스터링 알고리즘으로는 K-평균(K-means), DBSCA..

머신러닝 2023.05.04

머신 러닝에서의 지도 학습 (Supervised Learning)

1. 지도 학습의 기본 개념 지도 학습(Supervised Learning)은 인공지능 분야에서 가장 널리 사용되는 학습 방법 중 하나로, 입력 데이터와 그에 상응하는 정답 레이블을 사용하여 모델을 학습시키는 과정입니다. 지도 학습의 목적은 학습 데이터를 통해 일반화된 가중치와 편향을 학습하여 새로운 입력 데이터에 대해 정확한 예측을 수행하는 것입니다. 2. 지도 학습의 종류 지도 학습은 크게 분류(Classification)와 회귀(Regression)로 나뉩니다. 2.1. 분류(Classification) 분류는 입력 데이터를 두 개 이상의 이산적인 범주로 구분하는 지도 학습 방법입니다. 분류 모델은 주어진 입력 데이터를 각 범주에 속할 확률로 나타내며, 가장 높은 확률을 가진 범주로 예측합니다. 대..

머신러닝 2023.05.04

베이지안 최적화를 활용한 인공지능 하이퍼파라미터 최적화

1. 베이지안 최적화란? 베이지안 최적화(Bayesian optimization)는 인공지능 모델의 하이퍼파라미터를 최적화하기 위한 방법 중 하나로, 베이지안 확률론에 기반한 순차적 최적화 전략을 사용합니다. 베이지안 최적화는 확률 모델을 사용하여 목표 함수의 불확실성을 추정하고, 이를 기반으로 하이퍼파라미터의 최적값을 찾아내는 방법입니다. 2. 베이지안 최적화의 원리 베이지안 최적화의 핵심 원리는 다음과 같습니다. 2.1. 가우시안 프로세스(Gaussian Process) 베이지안 최적화에서는 가우시안 프로세스를 사용하여 목표 함수를 모델링합니다. 가우시안 프로세스는 무한한 개의 랜덤 변수로 구성된 확률 과정으로, 각 변수들의 상관 관계를 고려한 분포를 가집니다. 2.2. 확률 모델의 불확실성 추정 가..

머신러닝 2023.05.02
반응형