license: mit language: ko tags: - hate-speech - classification - korean - electra datasets: - jeanlee/kmhas_korean_hate_speech model_name: kcELECTRA-based Korean Hate Speech Classifier

kcELECTRA-based Korean Hate Speech Classifier

이 모델은 beomi/kcELECTRA-base-v2022를 기반으로, jeanlee/kmhas_korean_hate_speech 데이터셋을 사용해 한국어 혐오 표현 분류 태스크에 맞춰 파인튜닝한 모델입니다.

🧠 모델 구조

✅ Base Model: kcELECTRA-base-v2022 (한국어 코퍼스 기반 사전학습 ELECTRA)
✅ Head: Sequence Classification Head (Binary: 혐오 / 비혐오)
✅ Output: label=1 (혐오), label=0 (비혐오)

🗂 데이터셋 정보

출처: jeanlee/kmhas_korean_hate_speech
형태: 텍스트 + 8가지 혐오 표현 레이블
전처리 방식:
- 라벨 8 (not_hate_speech)은 0, 그 외는 1로 binary classification 처리

🏋️‍♂️ 파인튜닝 정보

항목	값
Train Epochs	3
Batch Size	16
Optimizer	AdamW
Learning Rate	5e-5
Evaluation Metric	Accuracy (추가 가능)

🚀 사용 예시 (Inference)

from transformers import pipeline

model = pipeline("text-classification", model="jinkyeongk/kcELECTRA-toxic-detector")

text = "너 진짜 못생겼다"
result = model(text)

print(result)
# [{'label': 'LABEL_1', 'score': 0.987}]  ← 혐오

Downloads last month: 308

Safetensors

Model size

0.1B params

Tensor type

F32

Inference Providers NEW

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support