본문 바로가기
728x90
반응형

분류 전체보기100

[선형대수학] 3주차 0729 가우스 소거법 후 피봇의 위쪽값을 1이 되도록 만들기 = upper triangle 부분이 0이 되어야 하는거 아닌교,, 피봇이 있는 칼럼과 없는 칼럼을 구분-> 1,3번 열 -> 이와 같이 식으로 계산하여 미지수 계산 (x,y,u,v)의 4x1의 벡터를 구하고자 함 v의 식으로 표현 벡터 집합이 평행 이동 Ax=0의 조건을 만족하는 N(A) d에 의해서 만들어지는 상수? 행렬이 평행이동??? 벡터공간을 선형결합으로 설명 상수항이 더해지는 순간, 공간이라는 것이 깨짐? linear 한것이 깨짐? ; 벡터들이 선형적으로 독립되어있다. x1, x2,,,,xn 벡터가 있을때, (주어진 벡터 모두가 통째로 독립적인 관계인가?O, 서로 독립관계인가?X) 모든 선형계수의 결합은 0(0벡터)이 되어야 한다. >> 벡.. 2023. 7. 29.
[NLP] 정규표현식 정규표현식 (Regular Expression); 일정한 규칙(패턴)을 가진 문자열을 표현하는 방법 복잡한 문자열 속에서 특정한 규칙으로 된 문자열을 검색한 뒤 추출하거나 바꿀 때,문자열이 정해진 규칙에 맞는지 판단할 때도 사용 1. 문자열 판단하기; re. match( '패턴' , '문자열' )import rere.match('hello','hello, world!')# 전 문자열을 후 문자열에서 찾을 수 있으므로 정규표현식 매치객체가 반환됨re.match('python','hello, world!')# 전 문자열이 후 문자열에 없으므로 아무것도 반환되지 않음 정규 표현식은 re 모듈을 가져와서 사용하며 match함수에 정규표현식 패턴과 판단할 문자열을 넣는다. 2023. 7. 25.
[Machine Learning] SMOTE SMOTE( Synthetic Minority Oversampling Technique) 는 오버샘플링의 일종. 타겟변수의 범주별 비율이 맞지 않을 때? 사용했다. y값 y.value_counts() y.value_counts(normalize=True) normalize=True 를 넣어주면 비율로 확인할 수 있다. 아 팀프로젝트로 파산데이터 분석을 진행했었는데 타겟변수가 파산했는가 에 대한 여부였다. 파산 한 경우 : 1, 파산하지 않은 경우 : 0 거의 96% 이상이 타겟변수 0으로 쏠려 있는 것을 볼 수 있다. 이런 경우에는 0으로 과적합 될 가능성이 있다. 음.. 그러니까 독립변수가 어떠하더라도 대부분의 예측 결과로 0이 나올수도 있다 이 말..! 임의로 8:2의 비율로 오버샘플링 하였다. 굳이.. 2023. 7. 23.
[Machine Learning] Hyper Parameter 하이퍼 파라미터 파라미터는 모델 내부에서 결정되는 변수이다 각 파라미터는 데이터를 통해 구해지며 모델 내부 자체적으로 결정되는 값이기 때문에, 사용자가 임의로 설정할 수는 없다. ## 파라미터 VS 하이퍼파라미터 하이퍼 파라미터는 모델링 시 사용자가 직접 결정할 수 있는 변수이다. 각 파라미터는 최적의 값이 정해져 있지 않아서 사용자의 경험이나, 필요 조건에 따라 결정해야 한다. 만약 하이퍼 파라미터를 수동으로 결정하지 못하겠다면 그리드 서치( Grid Search) 나 베이지안 최적화( Bayesian Optimization) 방법을 사용해도 좋다. >>>https://data-yun.tistory.com/4 [Machine Learning] Grid Search 그리드 서치 그리드 서치(Grid Search) : 좋.. 2023. 7. 23.
728x90
반응형