1 용어 정리
용어 (glossary, terms, terminology, etc.)와 관련된 단어들이 많아 혼동되어 사용될 때가 있다. 서로 연관성과 포괄 범위에 따라 계층적(hierarchy)으로 대략적으로 구분할 수 있다. 이 계층 구조는 일반적으로 구체성과 사용 범위를 기준으로 정리했다. 반드시 이런 계층 구조를 갖는 다는 것이 아닌 대략적인 생각의 정리를 한것이기 때문에 다른 참고 문헌과 다를 수 있다. 아래는 용어와 관련된 주요 단어들의 계층 구조와 그 관계를 설명한 것이다.
1.1 Hierarchy of Terms Related to “Terminology”
Language (언어)
├─ Lexicon (어휘: 언어의 모든 단어 체계)
│ ├─ Word (단어: 단어, 언어의 기본 단위)
│ ├─ Vocabulary (어휘량: 특정 맥락에서 사용되는 단어들의 집합)
│ │ ├─ Terms (용어: 특정 의미가 부여된 전문적 단어)
│ │ │ ├─ Terminology (특정 분야의 용어 체계)
│ │ │ │ ├─ Terminology의 산출물
│ │ │ │ │ ├─ Glossary (용어집)
│ │ │ │ │ ├─ Thesaurus (단어 관계 구조: 유의어, 반의어 등)
│ │ │ │ │ └─ Ontology (개념 구조)
│ │ │ │ └─ Nomenclature-Based Terms (명명법: 이름 부여 규칙에 의거하여 만들어진 용어)
│ │ │ └─ Jargon (비공식적 전문 용어)
- Language (언어)
- 가장 상위 개념.
- 모든 용어(term)는 특정 언어의 표현 방식을 통해 전달된다.
- 예: 영어(English), 한국어(Korean)
- Lexicon (어휘)
- 특정 언어에서 사용되는 단어들의 집합.
- 모든 단어가 용어(term)는 아니지만, 용어는 어휘의 하위 집합에 속함.
- 예: 영어의 어휘 중 “algorithm”이나 “regression” 같은 단어.
- Word (단어)
- 언어의 가장 기본적이고 일반적인 단위.
- 역할: 모든 용어(term), 어휘(vocabulary), 전문 용어(terminology), 또는 다른 언어적 표현의 기본 단위.
- 위치: 계층의 최하단 (어휘 이전 단계)
- 모든 “Terms(용어)”는 “Words(단어)”에서 출발하므로 계층의 가장 기본적 구성 요소.
- Vocabulary (어휘량, 단어집합)
- 개인이나 특정 그룹이 사용하는 단어나 표현의 집합.
- 일반적으로 넓은 범위의 단어를 포함하며, 특정 전문성을 요구하지 않음.
- 예: 초등학생의 어휘량, 일반적인 대화에서 쓰이는 단어들.
- Terms (용어)
- 특정 개념, 아이디어, 또는 사물에 대해 지칭하는 단어들.
- 일반 어휘(vocabulary) 중에서도 구체적이고 정의된 단어를 의미.
- 예: “data,” “model,” “learning rate” 등.
- Terminology (전문 용어 체계)
- 특정 분야에서 사용하는 용어(term)들의 집합.
- 용어의 정의, 사용 방법, 상호 연관성을 포함하며, 체계적으로 정리됨.
- 예: 의료 용어(medical terminology), 법률 용어(legal terminology), AI 용어(artificial intelligence terminology).
- Nomenclature-based Terms (명명법)
- Nomenclature: 특정 분야에서 사물이나 개념을 체계적으로 명명하는 방식.
- 용어(terms)가 생성되고 정의되는 체계.
- 예: 화학의 분자 명명법(IUPAC nomenclature), 생물학의 학명 체계, 공식 명칭 (Official Names), 표준화된 용어 (Standardized Terms), 기술적 용어 (Technical Terms), 학명 (Scientific Names), 코드 또는 약어 (Codes/Acronyms)
- Jargon (전문 용어/은어):
- 전문 용어 체계(terminology)의 비공식적/비체계적 하위 집합.
- 특정 집단 내에서 자연스럽게 발생하여 특정 그룹에서만 사용되며, 외부인은 이해하기 어렵다.
- 때로는 비격식적이거나 약어로 사용됨 (반드시 체계적이지 않을 수 있음)
- 예: “push the envelope” (항공 공학), “debugging” (프로그래밍)
- Glossary (용어집)
- 특정 문서, 주제, 또는 책에서 사용된 용어(term)와 그 정의를 정리한 목록.
- 전문 분야 용어(term) 또는 terminology의 서브셋을 정리한 자료.
- 예: 교과서 뒤의 용어집, 연구 보고서의 부록.
- Thesaurus (유의어 사전)
- 단어들(terms) 간의 관계를 설명한 자료.
- 주로 유사어, 반의어, 상위어, 하위어를 포함함.
- 예: 단어 “big”의 유의어는 “large,” “huge.”
- 단어들(terms) 간의 관계를 설명한 자료.
- Ontology (온톨로지, 개념 모델)
- 특정 도메인에서 사용되는 용어(term)와 그 관계를 구조화한 지식 체계.
- Glossary나 terminology보다 복잡하며, 개념 간의 관계를 설명.
- 예: 생물학에서 유전자-단백질 간 관계를 나타내는 온톨로지.
1.1.1 Example of Hierarchy in Context
1.1.1.1 Computing and Programming
- Language: Python (programming language)
- Lexicon: All valid identifiers, keywords, and syntax in Python.
- Word: “Function” (basic programming concept).
- Vocabulary: Words commonly used by data scientists using Python.
- Terms: Specialized terms in data science programming.
- Jargon: “ETL pipeline” (informal term understood by data engineers).
- Terminology: The standardized terminology in data science and programming.
- Terminology의 산출물:
- Glossary: A Python library documentation glossary defining “NumPy array” as a multi-dimensional array object.
- Thesaurus: Relationships between “NumPy array,” “Pandas DataFrame,” and “Python lists.”
- Ontology: A knowledge graph connecting “Data preprocessing,” “Feature engineering,” and “Machine learning pipelines.”
- Nomenclature-Based Terms: “NaN” (Not a Number) in data handling, defined by IEEE 754 standard for floating-point arithmetic.
Language (Python) ├─ Lexicon (All valid identifiers, keywords, and syntax in Python) │ ├─ Word ("Function") │ ├─ Vocabulary (Words commonly used by data scientists using Python) │ │ ├─ Terms (Specialized terms in data science programming) │ │ │ ├─ Jargon ("ETL pipeline", "Model drift") │ │ │ ├─ Terminology (Standardized terminology in programming and data science) │ │ │ │ ├─ Glossary ("NumPy array": Multi-dimensional array object) │ │ │ │ ├─ Thesaurus (Relationships: "NumPy array" ↔ "Pandas DataFrame" ↔ "Python lists") │ │ │ │ ├─ Ontology (Knowledge graph: "Data preprocessing" ↔ "Feature engineering" ↔ "Machine learning pipelines") │ │ │ │ └─ Nomenclature-Based Terms ("NaN": Not a Number, defined by IEEE 754 standard) - Terminology의 산출물:
- Terms: Specialized terms in data science programming.
- Lexicon: All valid identifiers, keywords, and syntax in Python.
1.1.1.2 Biology
- Language: English
- Lexicon: All English words, including formal and informal usage.
- Word: “Gene,” “DNA,” “Mutation” (basic units of language with general meanings).
- Vocabulary: Words used by genomics researchers, including both common (“Genetic”) and specialized terms (“Polymorphism”).
- Terms: Specialized words in genomics with precise definitions. “Single Nucleotide Polymorphism (SNP): a single base change in a DNA sequence”
- Jargon: Informal terms or shorthand used by genomics professionals, often inaccessible to outsiders. “GWAS” (Genome-Wide Association Study)
- Terminology: Standardized terms used in genomics for precise communication. “Genotype” (the genetic makeup of an organism).
- Terminology의 산출물:
- Glossary: A genomics textbook glossary defining “Transcriptomics” as the study of RNA transcripts in a cell or organism
- Thesaurus: Showing relationships between “Genotype” (genetic composition), “Allele” (variant form of a gene), and “Haplotype” (group of alleles inherited together).
- Ontology: Gene Ontology (GO) mapping relationships between “Biological processes,” “Molecular functions,” and “Cellular components.”
- Nomenclature-Based Terms: Terms created based on standard naming conventions in genomics.”BRCA1” (a gene associated with breast cancer susceptibility, named following gene nomenclature rules).
- Terminology의 산출물:
- Terms: Specialized words in genomics with precise definitions. “Single Nucleotide Polymorphism (SNP): a single base change in a DNA sequence”
- Lexicon: All English words, including formal and informal usage.
Language (English)
├─ Lexicon (All genomics-related words)
│ ├─ Word ("Gene," "DNA," "Mutation")
│ ├─ Vocabulary (General and domain-specific words)
│ │ ├─ Terms (Precise definitions: "SNP," "Epigenetics")
│ │ │ ├─ Jargon (Shorthand: "GWAS," "NGS")
│ │ │ ├─ Terminology (Standardized concepts: "Genotype," "Phenotype")
│ │ │ │ ├─ Glossary (Definitions: "Transcriptomics")
│ │ │ │ ├─ Thesaurus (Relationships: "Genotype" ↔ "Allele" ↔ "Haplotype")
│ │ │ │ ├─ Ontology (Gene Ontology: "Biological process" ↔ "Molecular function")
│ │ │ │ └─ Nomenclature-Based Terms ("BRCA1," "rs1234567")
1.1.1.3 Medical Field
- Language: Latin and English (used in medical communication)
- Lexicon: All terms used in medical practice.
- Word: “Heart” (common term in English).
- Vocabulary: Words used by cardiologists.
- Terms: Medical terms with precise definitions.
- Jargon: “Code blue” (hospital jargon for cardiac arrest emergency).
- Terminology: Standardized medical terms in cardiology.
- Terminology의 산출물:
- Glossary: A medical glossary defining “Myocardial infarction” as a heart attack.
- Thesaurus: Linking “Myocardial infarction” with “Cardiac ischemia” (related condition) and “Angina” (symptom).
- Ontology: A structured model showing how “Atherosclerosis” leads to “Coronary artery blockage,” resulting in “Myocardial infarction.”
- Nomenclature-Based Terms: “ICD-10 I21.9” (International Classification of Diseases code for acute myocardial infarction, unspecified).
- Terminology의 산출물:
- Terms: Medical terms with precise definitions.
- Lexicon: All terms used in medical practice.
Language (Latin and English)
├─ Lexicon (All terms used in medical practice)
│ ├─ Word ("Heart", "Lung")
│ ├─ Vocabulary (Words used by cardiologists and medical professionals)
│ │ ├─ Terms (Medical terms with precise definitions)
│ │ │ ├─ Jargon ("Code blue": Hospital slang for cardiac arrest emergency)
│ │ │ ├─ Terminology (Standardized medical terms in cardiology)
│ │ │ │ ├─ Glossary ("Myocardial infarction": Defined as a heart attack in a glossary)
│ │ │ │ ├─ Thesaurus (Relationships: "Myocardial infarction" ↔ "Cardiac ischemia" ↔ "Angina")
│ │ │ │ ├─ Ontology (Concept map: "Atherosclerosis" ↔ "Coronary artery blockage" ↔ "Myocardial infarction")
│ │ │ │ └─ Nomenclature-Based Terms ("ICD-10 I21.9": Classification code for acute myocardial infarction)
1.2 정리 요약
- Lexicon: Comprehensive vocabulary encompassing all terms in medical practice, including both common and specialized words.
- Word: The basic building blocks of language, such as “Heart” or “Lung.”
- Vocabulary: Terms specific to medical practice or subfields (e.g., cardiology).
- Terms: Precise, specialized language used by medical professionals to ensure accuracy.
- Terminology: Formal, standardized terms (e.g., “Myocardial infarction”).
- Glossary: Definitions of terms for educational purposes.
- Thesaurus: Showing semantic relationships between terms.
- Ontology: Structural knowledge models explaining interdependencies.
- Nomenclature-Based Terms: Official codes or identifiers for conditions, such as ICD-10 classification.
- Jargon: Informal shorthand (e.g., “Code blue”).
- Terminology: Formal, standardized terms (e.g., “Myocardial infarction”).