Wikipedia word dump: Wikipedia
Tuesday, November 28th, 2006 by Agro Rachmatullah
In the spirit of recursivity, I hunted words from the Wikipedia article on Wikipedia. I got 204 words, which boosted my word count to 2368.
There are some interesting findings…
First, "programmer" and "user" have 2 forms, one with an elongated end and one without. Compare プログラマー (puroguramaa) and ユーザー (yuuzaa) vs. プログラマ (purogurama) and ユーザ (yuuza). Does this duality exist in similar cases? In EDICT, I found メンバー (membaa) and メンバ (memba) which both mean member. However, for other words like ライダー (raidaa, rider), リーダー (riidaa, leader), and スイマー (suimaa, swimmer), there is no corresponding form.
Second, there are 2 versions of "version" (no pun intended). In this article ヴァージョン (vaajon) is spotted. Another form (not in this article) is バージョン (baajon). In general, foreign words with "v" can be transliterated to v (like ヴ (vu) and ヴァ (va)) and b (like バ (ba) and ブ (bu)). For example, ヴィールス (viirusu) and ビールス (biirusu) are both valid (don’t say balid) transliteration of "virus". It all depends on the taste of the user. From what I see, the b form is a lot more popular (not limited to those 2 examples, but generally).
Third, some unexpected katakana: カジュアル (kajuaru, casual), サーチ (saachi, search), シソーラス (shisoorasu, thesaurus), オランダ (oranda (suspiciously similar to "belanda"), Holland)
Being illiterate sucks, so I have decided to learn grade 4 kanji after my word count reaches 2500.
Here are the words from this article (which also ends the entry):
| Kanji | Kana | English |
|---|---|---|
| インターネット | the Internet | |
| オープン | open | |
| 方式 | ほうしき | system |
| 多言語 | たげんご | multilingual |
| 百科 | ひゃっか | many objects (for study) |
| 代わり | かわり | substitute |
| インターフェース | interface | |
| 使用 | しよう | use |
| ウェブ | web | |
| エンサイクロペディア | encyclopedia | |
| 活動 | かつどう | activity |
| 主 | おも | main |
| 発足 | ほっそく | starting |
| ソフトウェア | software | |
| ハードウェア | computer hardware | |
| 先行 | せんこう | preceding |
| データ | data | |
| ベース | base | |
| ダウンロード | download | |
| 前後 | ぜんご | approximately |
| ただし | but, however | |
| ほど | approximately | |
| 入れる | いれる | to put in |
| 立ち上げる | たちあげる | to start (something) |
| 数名 | すうめい | several people |
| 記事 | きじ | article |
| アクセス | access | |
| ランキング | ranking | |
| ユーザ | user | |
| 筆者 | ひっしゃ | writer |
| 次ぐ | つぐ | to come after |
| 等しい | ひとしい | similar |
| 数千 | すうせん | thousands |
| 活発 | かっぱつ | active |
| 仕組み | しくみ | plan |
| ファイル | file | |
| 集計 | しゅうけい | aggregate |
| 行い | おこない | deed |
| 回数 | かいすう | number of times |
| 多様 | たよう | diversity |
| つまり | in other words | |
| しかも | furthermore | |
| 使いやすい | つかいやすい | easy to use |
| 少数 | しょうすう | few |
| 多数 | たすう | countless |
| 受け手 | うけて | viewer |
| 長期 | ちょうき | long time period |
| 長期間 | ちょうきかん | extended period of time |
| ユダヤ | Judea | |
| 遊び場 | あそびば | playground |
| コピー | copy | |
| レフト | left | |
| 用 | よう | use |
| ライセンス | license | |
| 自体 | じたい | itself |
| ルール | rule | |
| 一切 | いっさい | all |
| 定める | さだめる | to decide |
| 意思 | いし | intention |
| 意思決定 | いしけってい | decision-making |
| 中立 | ちゅうりつ | neutrality |
| 全体 | ぜんたい | whole |
| 発言 | はつげん | proposal |
| 同様 | どうよう | identical |
| モデル | model | |
| サーバ | server | |
| プロセス | process | |
| 一定 | いってい | fixed, settled |
| 期間 | きかん | period |
| 委員長 | いいんちょう | committee chairman |
| 仕様 | しよう | method |
| メーリング | mailing | |
| リスト | list | |
| デザイン | design | |
| 調整 | ちょうせい | regulation |
| 話題 | わだい | topic |
| メタ | meta | |
| 取り上げる | とりあげる | to pick up |
| 話し合い | はなしあい | discussion |
| フォーマット | format | |
| 表記 | ひょうき | declare |
| 大半 | たいはん | majority |
| ガイドライン | guideline | |
| 万人 | ばんじん | everybody |
| 部分 | ぶぶん | part |
| 決着 | けっちゃく | conclusion |
| 強調 | きょうちょう | emphasis |
| 所有 | しょゆう | ownership |
| 所有者 | しょゆうしゃ | owner |
| しばしば | again and again | |
| 両者 | りょうしゃ | pair |
| 数ヶ月 | すうかげつ | several months |
| メンバー | member | |
| 先立つ | さきだつ | to precede |
| オンライン | on-line | |
| 当初 | とうしょ | at first |
| トラフィック | traffic | |
| 下す | くだす | to lower |
| 同社 | どうしゃ | the same firm |
| プログラマー | programmer | |
| 着想 | ちゃくそう | idea |
| コンピュータ | computer | |
| プログラマ | programmer | |
| カリフォルニア | California | |
| サンディエゴ | San Diego | |
| 発する | はっする | to emit |
| 夕食 | ゆうしょく | dinner |
| コンセプト | concept | |
| カジュアル | casual | |
| 重ねる | かさねる | to add |
| 読者 | どくしゃ | reader |
| 反対意見 | はんたいいけん | dissenting opinion |
| 立ち上げ | たちあげ | starting up (e.g., business, computer) |
| アドレス | address | |
| 非公式 | ひこうしき | informal |
| 打ち切る | うちきる | to stop |
| 打ち切り | うちきり | end |
| 人員 | じんいん | personnel |
| ペース | pace | |
| サーチ | search | |
| カルチャー | culture | |
| 町村 | ちょうそん | towns and villages |
| 市町村 | しちょうそん | cities, towns and villages |
| 自動 | じどう | automatic |
| 主題 | しゅだい | subject |
| 乗り出す | のりだす | to embark on |
| シソーラス | thesaurus | |
| 教科書 | きょうかしょ | text book |
| 教科 | きょうか | subject |
| 同年 | どうねん | that year |
| コード | code | |
| ネーム | name | |
| ヴァージョン | version | |
| 運用 | うんよう | application |
| 始める | はじめる | to begin |
| 組み合わせ | くみあわせ | combination |
| 組み合わせる | くみあわせる | to combine |
| 記号 | きごう | symbol |
| 一台 | いちだい | one machine |
| 時点 | じてん | point in time |
| 商業 | しょうぎょう | commerce |
| コントロール | control | |
| 交流 | こうりゅう | (cultural) exchange |
| 表明 | ひょうめい | declaration |
| 度々 | たびたび | often |
| 速やか | すみやか | speed |
| 何回 | なんかい | how many times? |
| ユーザー | user | |
| 何人 | なにびと | everyone |
| 話者 | わしゃ | speaker |
| 強化 | きょうか | enhancement |
| 旨 | むね | principle |
| アナウンス | announce(ment) | |
| フロリダ | Florida | |
| 速度 | そくど | speed |
| 来たす | きたす | to cause |
| 会員 | かいいん | member |
| 年会 | ねんかい | conference |
| 申す | もうす | to say |
| 申し入れる | もうしいれる | to propose |
| 申し入れ | もうしいれ | proposal |
| 四半期 | しはんき | quarter (of a year) |
| 予算 | よさん | estimate |
| 事実上 | じじつじょう | actually |
| 内国 | ないこく | home country |
| 有する | ゆうする | to own |
| 対する | たいする | to oppose |
| イタリア | Italy | |
| 地方 | ちほう | region |
| オランダ | Holland | |
| ルーマニア | Romania | |
| ポーランド | Poland | |
| アーカイブ | archive | |
| 考え方 | かんがえかた | way of thinking |
| マイクロ | micro | |
| フィルム | film | |
| 年代 | ねんだい | era |
| デジタル | digital | |
| テキスト | text | |
| 第一 | だいいち | first |
| 自発 | じはつ | spontaneous |
| 作り上げる | つくりあげる | to construct |
| ニュース | news | |
| 物事 | ものごと | things |
| 空想 | くうそう | fantasy |
| コンテンツ | contents | |
| 文書 | ぶんしょ | document |
| 引用 | いんよう | quotation |
| ソース | source | |
| パブリック | public | |
| ドメイン | domain | |
| 音声 | おんせい | voice, (the concept of) sound |
| 商用 | しょうよう | for business |
| 受け入れる | うけいれる | to accept |
| 受け入れ | うけいれ | acceptance |
| 生物 | せいぶつ | living things |
| 分野 | ぶんや | field |
| カバー | cover (e.g., book) | |
| ハイパー | hyper | |
| エッセイ | essay | |
| 指す | さす | to point |
| 目指す | めざす | to aim at |
| アイデア | idea | |
| 皮肉 | ひにく | satire |


