get_data

get_data.fix_random_seed(seed: int = 42) → None[source]

乱数のシードを固定する。

Parameters

seed (int) – 乱数のシード。

get_data.get_ididx_mjdcols_dataframe(df: pandas.core.frame.DataFrame, df_source: pandas.core.frame.DataFrame) → pandas.core.frame.DataFrame[source]

df_source の unique な objectid を index、mjd を columns とした pandas.DataFrame を作成し、df の m_ap30 の値を埋めたものを返す。

Parameters
  • df (pandas.DataFrame) – 埋める m_ap30 の値を保持した表。

  • df_source (pandas.DataFrame) – 返り値の index となる objectid と、columns となる mjd を保持した表。

Returns

df_return – df_source の unique な objectid を index、mjd を columns とした pandas.DataFrame で、df の m_ap30 の値を埋めたもの。

Return type

pandas.DataFrame

get_data.get_unique_list(df: pandas.core.frame.DataFrame, col: str) → numpy.ndarray[source]

指定した pandas.DataFrame のカラムの unique なリストを、 昇順にソートしたものを返す。

Parameters
  • df (pandas.DataFrame) – 目的の表。

  • col (str) – 目的のカラム名。

Returns

unique_list – 指定した pandas.DataFrame のカラムの unique なリストを、 昇順にソートしたもの。

Return type

numpy.ndarray

get_data.load_input_csv(input_filepath: str, usecols: List[str]) → pandas.core.frame.DataFrame[source]

入力 csv ファイルを、必要な columns を選択して読み込む。

Parameters
  • input_filepath (str) – 入力 csv ファイルへのパス。

  • usecols (list of str) – 必要なカラム名。

Returns

df_orig – 入力 csv ファイルの、選択した columns の表。

Return type

pandas.DataFrame