목록2025/04 (10)
Fear is a habit. I'm not afraid.
결론부터 말하자면,1. 자바 프로그래밍에서 2. int형인 1과, float 1.0을 비교 연산자를 통해 비교하였을 때같다.자바 프로그래밍 기초 수업을 듣고 있는데, 비교연산자 예시에서 아래와 같은 예시를 보았다.package javastudy;public class Study17 { public static void main(String[] args) { int num3 = 1; float num4 = 1.0f; System.out.println(num3==num4); }} 결과true 상식적으로는 1이랑 1.0이랑 값이 같으니 당연히 true가 나온다고 생각을 했다.하지만 이것이 어떤 단계적 순서로 처리가 되는지 궁금해져서 찾아보았다.비교 연산 순서변수..

앱 과정을 새롭게 시작하면서 컴퓨터 아키텍처의 개요에 대한 설명을 들었다.찾아보니 하버드 아키텍처, 폰 노이만 아키텍처는 정확하게는 메모리 아키텍처에 대한 설명이라고 한다.그래서 메모리 아키텍처의 정의, 각 아키텍처에 대해 간단하게 조사해보았다.메모리 아키텍처정의메모리 아키텍처는 정보를 저장하고 검색하는 가장 빠르고, 가장 안정적이며, 가장 내구성이 좋고, 가장 비용이 적게 드는 방법을 조합하여 컴퓨터 데이터 저장소를 구현하는 데 사용되는 방법을 설명한다. 특정 애플리케이션에 따라 다른 요구 사항을 개선하기 위해 이러한 요구 사항 중 하나를 절충해야 할 수도 있다. 또한 메모리 아키텍처는 이진 숫자가 전기 신호로 변환되어 메모리 셀에 저장되는 방식과 메모리 셀의 구조에 대해서도 설명한다.예를 들어, 동적..

이상치 데이터(Outlier, 아웃라이어)는 전체 데이터의 패턴에섯 벗어난 이상 값을 가진 데이터로,이상치로 인해 머신러닝 모델의 성능에 영향을 받는 경우가 발생하기 쉽다.이러한 이상치를 찾아내는 방법은 여러가지가 있는데, IQR 기법을 활용하여 박스 플롯 방식으로 시각화하는 방법에 대해 정리해보았다.이상치를 탐지하는 방법시각적 방법 : 그래프를 사용하여 이상치를 시각적으로 탐지.박스플롯(Box Plot) : 데이터 분포를 시각화하고 이상치를 탐지하는데 유용산점도(Scatter Plot) : 두 변수 간의 관계에서 이상치를 시각적으로 탐지통계적 방법IQR(Interquartile Range) 방법 : 데이터의 1사분위수(Q1)와 3사분위수(Q3)를 사용하여 이상치를 탐지Z-점수(Z-score) 방법 : ..
NumPyNumPy란?Python에서 과학 컴퓨팅을 위한 기본 패키지.다차원 배열과 다양한 연산을 지원하는 과학 계산에 대한 빠른 연산을 위한 다양한 루틴을 제공하는 Python 라이브러리.NumPy가 빠른 이유?벡터화는 코드에 명시적인 루프, 인덱싱이 없는 상태를 말한다. 벡터화된 코드는 여러 가지 장점을 가지고 있다.벡터화된 코드는 더 간결하고 읽기 쉽다.일반적으로 코드 줄이 적을수록 버그도 적다.코드는 수학 표준 표기법과 유사하다.벡터화는 더 "파이썬스러운" 코드를 생성한다. 벡터화가 없다면 코드는 비효율적이고 읽기 어려운 for문으로 가득 찰 것이다.브로드캐스팅은 연산의 암묵적인 요소별 동작을 설명하는 데 사용되는 용어이다. 일반적으로 NumPy에서는 산술 연산뿐만 아니라 논리 연산, 비트 연산,..

환경: windows 10 파이썬 버전: 3.12.9 파이썬을 설치하면 pip 패키지가 설치가 되는데, 설치하고 cmd에서 실행이 안됨. 다시 삭제해야 하나 했는데, 파이썬 setup 프로그램을 다시 클릭해보니 설치를 변경하는 항목이 있었다.그래서 설치 변경을 해봄. 1. Modify 클릭 2. Next 버튼 클릭 3. 환경변수 추가 (Add Python to environment variables) 후 Next 버튼 클릭 환경변수란?프로세스가 컴퓨터에서 동작하는 방식에 영향을 미치는, 동적인 값들의 모임이다. 환경 변수는 실행 중인 프로세스가 컴퓨터에서 작동하는 방식에 영향을 줄 수 있는 사용자 정의 값이다. 환경 변수는 프로세스가 실행되는 환경의 일부이다. *모든 프로세스에는 환경 변수 집합과 해당 ..
오늘 파이썬 수업에서 피보나치 수열을 구현하는 방법을 실습했다.생각보다 잘 떠오르지 않아서 얼레벌레 작성했는데.. 상당히 코드가 별로여서 결국 지피티니 형에게 물어보게 됨.일종의 반성문으로.. 내가 작성한 코드 그리고 효율적으로 개선된 코드에 대해 정리해보았다.피보나치 수열의 처음 10개 항을 구하여 공백으로 구분된 문자열로 출력하시오.[조건]피보나치 수열은 첫 두 항이 0과 1이며,이후의 항은 이전 두 항의 합으로 정의된다.출력은 한 줄로 하며, 숫자들은 공백으로 구분한다.내가 작성한 코드i = 0ls = [0, 1]while i 내가 생각하는 코드의 문제점1. 10개의 항을 구하는 데, 초기값 2개를 설정하고 그것의 나머지 (8개) 개수를 셋팅: 하드코딩 요소이후에 더 보완점이 있을지 지피티에게 코드..
어제 Orange Data Mining 툴을 이용하여 예측모델을 통해 확인하는 실습을 했다. GUI이기 때문에 간편하고 가시적으로 성능을 확인할 수 있었는데 강사님께서 왜 이 모델을 사용하였는지 궁금해져서 각 모델에 대해 공부해보았다. 분류란 기존 데이터가 어떤 레이블에 속하는지 패턴 알고리즘으로 인지한 뒤에 새롭게 관측된 데이터에 대한 레이블을 판별하는 것이다. 분류 알고리즘 종류나이브 베이즈 (Naïve Bayes)로지스틱 회귀 (Logistic regression)결정 트리 (Decision tree)서포트 벡터 머신 (SVM, Support Vector Machine)최소 근접 알고리즘 (Nearest Neighbor)신경망 (Neural Network)앙상블 (Ensemble) 앙상블 방법 (..

결정 클래스 값 종류의 유형에 따라 긍정/부정과 같은 2개의 결괏값만 가지는 이진 분류와 여러 개의 결정 클래스 값을 가지는 멀티 분류로 나눌 수 있다. 종류정확도오차 행렬정밀도재현율F1 스코어ROC AUC 이진/멀티 분류에 모두 적용되는 지표이지만, 특히 이진 분류에서 더욱 중요하게 강조하는 지표이다. 정확도 (Accuracy)실제 데이터에서 예측 데이터가 얼마나 같은지를 판단하는 지표.정확도 = 전체 예측 데이터 건수 / 예측 결과가 동일한 데이터 건수.하지만 이진 분류의 경우 데이터 구성에 따라 ML 모델의 성능을 왜곡할 수 있기 때문에 정확도 수치 하나만 가지고 성능을 평가하지 않는다.특히 불균형한 레이블 값 분포에서 ML 모델의 성능을 판단할 경우, 적합한 평가 지표가 아니다. 오차행렬 (con..