Aritalab:Lecture/Programming/Cpp
| Wiki Top | Up one level | レポートの書き方 | Arita Laboratory |
|
"C makes it easy to shoot yourself in the foot; C++ makes it harder, but when you do it blows your whole leg off."
C++プログラミング
C++はC言語の完全な上位互換ですが、オブジェクト指向型という点でC言語とは全く違うプログラミング思想に基づいています。簡単に言うと、JavaはC++の(思想の)利点を活かせるように新開発された言語です。
このページでは、C++の基本原則を書いています。より細かいプログラミングテクニックやサンプルプログラムがTipsのページにもあります。
マクロ, inlineの利用
C言語でマクロが果たしていた役割を、C++ではinline関数を用いて実現できます。 関数定義を
inline int cmp(const char& x, const char& y)
{ if (x < y) return -1; else if (x > y) return 1; else return 0; }
と書いておくと、cmp(x,y)という呼び出しはコンパイル時に全てソース中に展開されます。 実行ファイルが大きくなるのは欠点ですが、処理速度を犠牲にせずに可読性が上がります。
ヘッダーファイル
利用する関数の型情報は.hや.hhという拡張子を持つヘッダーファイルに記述し、それをプログラムの先頭で読み込みます。一番有名なヘッダーは<stdio.h>と<iostream>でしょう。
#include <stdio.h>
iostreamも以前は拡張子(.h)を付けてインクルードしていたのですが、標準化の際に付けないことが決まりました。なので以下のように書いてください。
#include <iostream> using namespace std;
二行目のusing以下は、iostreamで定義される標準入出力 std::cin, std::cout を、std::というネームスペース名無しで利用するために記述します。 C++でCの入出力を使うには
#include <cstdio>
としてください。
ヘッダーファイルはクラスを定義するソースプログラム毎に用意します。ディレクトリ内に.cや.cpp等のファイルと混在してくると面倒です。例えばinclというディレクトリを作り、その中にヘッダーを集めておくと便利でしょう。(コンパイル方法は後述。)
各ヘッダーファイルは、プログラム中で複数回読み込むとエラーになります。ヘッダーファイルの先頭に
#ifndef LIST_H #define LIST_H #include "iterator.h" : #endif
のように、ifndefのおまじないを入れておきましょう。
ファイルの入出力
C++では入出力にオペレータ<<, >>を使います。
- 与えられたファイルを全て結合して表示する cat.cpp
#include <iostream>
#include <fstream>
#include <string>
#include <vector>
using namespace std;
int main(int argc, char *argv[])
{
vector<string> lines;
string line;
for(int i=1; i < argc; i++) {
//argv[0]には実行ファイル名が入っている
ifstream fin(argv[i], ios::in);
if(!fin) {// 必ずエラーチェックを入れる
cout << "Error: cannot open file(" << argv[i] << ")" << endl;
exit(1);
}
while(getline(fin, line))
lines.push_back(line);
// fin.close(); ファイルはクローズしなくて良い。
}
for(vector<string>::iterator itr=lines.begin();
itr != lines.end(); ++itr)
cout << *itr << "\n";
}
これは STL を使うプログラム例なのでファイルの中身をすべて vector の中にコピーしています。 (ファイルの内容を出力するためだけなら、こんなことをしてはいけません。)
クラス定義
クラスは以下のように定義します。
class class名 {
private:
// 外からアクセスできない変数やメンバー関数
public:
// 外からアクセス可能な変数やメンバー関数
};
C言語における構造体との主な違いはアクセス制限です。
クラスと構造体の違い
以下のようなC構造体を考えましょう。
struct list {
char* name;
struct list* next;
struct list* prev;
};
構造体を初期化するには、構造体用のメモリと名前のメモリをそれぞれ malloc しなくてはなりません。
...
struct list *p;
char* sampleName;
...
if ((p = (struct list *) malloc(sizeof(struct list))) == NULL) {
printf("malloc error\n"); exit(EXIT_FAILURE);
}
if (p->name = (char*) malloc(sizeof(char)*20)) == NULL {
printf("malloc error\n"); exit(EXIT_FAILURE);
}
strcpy(p->name, sampleName);
...
これでは全てのユーザが構造体の中身を熟知していないと使えません。 とりわけ、nameに malloc が必要なことや、20文字で十分かという判断は面倒です。 そこでC++ではこれをクラスにします。
public class Node {
string name;
Node* next;
Node* prev;
public:
Node(string str) : name(str) { prev=next=NULL; } //コンストラクタ
~Node() {} //デストラクタ
...
string getName() { return name; }
};
コンストラクタが、構造体の malloc に対応します。 Cにおける char* 型はできる限り STLの string で置き換えましょう。こうすると、文字列の長さを気にしなくてよくなります。 実際、上のクラスでも 20 という定数や malloc が消えています。
自分自身を参照するthis
クラスの中で、自分自身を参照するには this というポインタを使います。 つまり実体を参照する場合は *this になります。 このポインタはコピーコンストラクタを定義する際に出てきます。
public class Node {
...
Node& Operator=(const Node& x)
{ name = x.name; next = x.next; prev = x.prev; return *this; }
...
}
最後に return *this; としている点に注意してください。 自分自身を戻り値として返し、その際に参照渡し(&)をしています。 メンバー変数をたとえば this->name と参照することもできます。 (ちなみに、上のオペレータ定義はポインタの値をNodeクラスから持ち出す「不適切なコード」です。実際にはこのようなコードをかくことは無いでしょう。)
STL
STLとは Standard Template Library の略でC++が標準でサポートするデータ構造ライブラリです。 使えるデータ構造がある場合は積極的に使いましょう。逆に、標準でサポートされないライブラリはあまり使わないようにしましょう。
できる限りstringクラスを使う
単純な文字列でも、できる限りstringクラスを使いましょう。自分でchar*を使うのを避けましょう。以下は、それでもchar*を使いたい人に向けたヒントです。
- 文字列は文字数+1の長さを宣言する。最後のnull文字分を忘れないように。
- 文字列のメモリはcallocで確保する。callocはmallocした後に0で初期化するのと同じです。
- strncpy, strncmpを利用する。strcpyやstrcmpはnull文字が出てくるまで処理を続けます。できる限り、処理する長さを自分で管理してください。
listはリスト、vectorは配列
STLでは、vectorクラスでも push_back 等の動的なサイズ変更が可能ですが、これははじめから余分にメモリを確保してあるためで、むやみに挿入や削除をすると効率が悪くなります。
イテレータを使う
STLにおいて配列、リスト、集合などのクラスはイテレータでスキャンすることができます。ポインタを用いて実装されています。
vector<int> V;
...
for(vector<int>::iterator I = V.begin(); I != V.end(); I++)
cout << *I << ' ';
ここで終了条件が V.end()になっていることに注意してください。beginは最初の要素を返すメソッドですが、endは最後の要素の次を返すメソッドです。
メモリ管理
コンストラクタとデストラクタ
C++のクラス定義では、例えば以下のような記述をします。
class list_node;
typedef list_node* lnode;
class list_node {
private:
list_node(const list_node&);
list_node& operator=(const list_node&);
public:
void* key;
lnode list_pred;
lnode list_succ;
list_node(GenPtr x=0x0) : key(x), list_pred(0), list_succ(0) {}
~list_node() {}
};
この中でlist_node(GenPtr x=0x0)とあるのがコンストラクタ、~list_node()がデストラクタで、それぞれクラスのインスタンス生成、消去時に呼び出されます。コンストラクタ内ではクラス変数の初期化、デストラクタ内では必要なくなったポインタのnull化などをしておくと良いでしょう。(後者は無駄に思えるかもしれませんが、バグをなくすのに役立ちます。)
コピーコンストラクタと演算子のオーバーロード
上の例でprivate指定でアクセス制限されているのが、コピーコンストラクタlist_node(const list_node&)と演算子=の定義list_node& operator=(const list_node&)になります。 コピーコンストラクタは、
list_node x = 既に定義されているlist_nodeクラス;
と=をつけて初期化する場合と、関数にクラスを(参照渡しではなく)値渡しするときに実行されます。 また、演算子=のほうは、
list_node x,y; x = y = 既に定義されているlist_nodeクラス;
と書かれたときに実行されます。上の例では、list_nodeクラスがユーザに無闇にコピーされることを防ぐためにprivate指定にしています。
new と delete
Cにおけるmalloc/freeと、new/deleteは同じではありません。 クラスのnew/deleteでは、コンストラクタとデストラクタが呼ばれることに注意しましょう。 基本データ型のnew/deleteは、基本的にmalloc/freeと同じですが、void*しか返さないmallocに比較して型キャストの必要がありません。
ですから、C++らしいプログラムを心がけるには、常にnew/deleteを使うと良いでしょう。
- 働きの全く同じ二つの例
char** cArray = new char*[10]; delete[] cArray; char** cArray2 = (char**) malloc(sizeof(char*)*10); free(cArray2);
Garbage Collection
Javaとの最大の違いは、メモリ管理を自分で行う点です。これは単に「遅れている」という訳ではなく、実時間プログラミングのようなGarbage collector(GC)が致命的となる場合にも使える「汎用性」と捉えましょう。C++の人が GC を使う際には Boost Library にある boost::shared_ptr を使うのが良いでしょう。
- Shared_ptr @Boost
Shared_ptr の仕組については、Scott Myersの教科書"Effective C++"を読んでください。私自身が昔Cppプログラマだった頃は Boehm Collectorをよく使いました(笑)。