NLPTrendData Vector Database: 벡터 임베딩을 저장하고 검색하는 가장 효율적인 방법

Domain-specific language model의 필요성

[가상생명연구팀 양승무 주임] ChatGPT의 시대가 도래하고 있습니다. AI 업계를 비롯한 다양한 산업과 분야에서도 ChatGPT의 우수성과 실용성이 인정되어, 많은 기업들이 ChatGPT의 적용을 추진하고 있습니다. 이러한 추세는 OpenAI와 같은 주요 기업들 뿐만…

TrendData Vector Database: 벡터 임베딩을 저장하고 검색하는 가장 효율적인 방법

Feature store: Fully managed service for ML Feature

[분석지능개발팀 임창대] What is Feature?ML(Machine Learning) 은 과거의 예시 데이터를 학습한 모델을 기반으로 새로운 데이터 예측을 수행합니다.ML 모델 학습에서 표 형태의 2차원 데이터를 사용하였을 때 행이 예시이고 열이 해당 예시를…

TrendData Vector Database: 벡터 임베딩을 저장하고 검색하는 가장 효율적인 방법

AI Fairness:편견 없는 인공지능을 위하여

[서비스개발팀 임용택] 2015년 6월, 미국 브루클린의 한 흑인 프로그래머는 여자친구와 찍은 사진을 보려던 중 깜짝 놀랄 일을 경험합니다. 구글 포토에 본인들의 사진이 “고릴라” 로 오토 태깅된 것을 보았기 때문입니다. 구글은…

TrendCodeData Vector Database: 벡터 임베딩을 저장하고 검색하는 가장 효율적인 방법

Handling Imbalanced Datasets

[Service Development Team Hwang Jun-sun] When supervising machine learning models, when a dataset with an unbalanced number of data between labels is used as training data, the phenomenon in which learning of samples belonging to a label with a small ratio is not performed well you will experience simply…

InteractionTrendData Vector Database: 벡터 임베딩을 저장하고 검색하는 가장 효율적인 방법

Time Series Data Analysis_TadGAN

[Prior Research Team, Ji-Hyun Song] The TadGAN algorithm developed by the MIT research team is known to have better performance than previously known models in detecting anomalies by analyzing time series data. Currently, many companies researching anomaly detection are working in various fields (financial…