§
    &`ƒi‡7  ã                   ó<  — d dl mZ d dlmZmZ d dlZd dlZd dlm	Z	 d dl
mZ d dlmZmZ edeej        ef         defd	„¦   «         Zed
„ ¦   «         Ze G d„ dej        ¦  «        ¦   «         Ze G d„ dej        ¦  «        ¦   «         Ze G d„ dej        ¦  «        ¦   «         Ze G d„ dej        ¦  «        ¦   «         Ze G d„ dej        ¦  «        ¦   «         Ze G d„ dej        ¦  «        ¦   «         Ze G d„ dej        ¦  «        ¦   «         Ze G d„ dej        ¦  «        ¦   «         Ze G d„ dej        ¦  «        ¦   «         Ze G d„ dej        ¦  «        ¦   «         Z e Z!e	 	 	 	 d*dej        d"e"d#e"d$ee"         d%edej        fd&„¦   «         Z#ed+d)„¦   «         Z$dS ),é    )Údeque)ÚOptionalÚUnionN)Úspaces)Ú	PublicAPI)ÚresizeÚrgb2grayÚenvÚreturnc                 ó"  — t          | t          ¦  «        sQt          | j        d¦  «        r+| j        j        t          | j        j        ¦  «        dk    rdS dt          | ¦  «        v S |                      d¦  «        p|                      d¦  «        S )a  Returns, whether a given env object or env descriptor (str) is an Atari env.

    Args:
        env: The gym.Env object or a string descriptor of the env (for example,
        "ale_py:ALE/Pong-v5").

    Returns:
        Whether `env` is an Atari environment.
    ÚshapeNé   FzAtariEnv<ALEzALE/zale_py:)Ú
isinstanceÚstrÚhasattrÚobservation_spacer   ÚlenÚ
startswith)r
   s    úy/home/jaya/work/projects/VOICE-AGENT/VIET/agent-env/lib/python3.11/site-packages/ray/rllib/env/wrappers/atari_wrappers.pyÚis_atarir      sŒ   € õ c3ÑÔð 
CåCÔ)¨7Ñ3Ô3ð	àÔ%Ô+Ð7ÝCÔ)Ô/Ñ0Ô0°AÒ5Ð5à5Ø¥ S¡¤Ð)Ð)ð ~Š~˜fÑ%Ô%ÐB¨¯ª¸	Ñ)BÔ)BÐBó    c                 óv   — | }	 t          ||¦  «        r|S t          |t          j        ¦  «        r|j        }ndS Œ7)z8Returns the gym env wrapper of the given class, or None.TN)r   ÚgymÚWrapperr
   )r
   ÚclsÚ
currentenvs      r   Úget_wrapper_by_clsr   &   sM   € ð €JðÝj #Ñ&Ô&ð 	ØÐÝ˜
¥C¤KÑ0Ô0ð 	Ø#œˆJˆJà4ðr   c                   ó   — e Zd Zd„ Zd„ ZdS )ÚClipRewardEnvc                 óF   — t           j                             | |¦  «         d S ©N)r   ÚRewardWrapperÚ__init__©Úselfr
   s     r   r#   zClipRewardEnv.__init__5   s!   € ÝÔ×"Ò" 4¨Ñ-Ô-Ð-Ð-Ð-r   c                 ó*   — t          j        |¦  «        S )z&Bin reward to {+1, 0, -1} by its sign.)ÚnpÚsign)r%   Úrewards     r   r)   zClipRewardEnv.reward8   s   € åŒwv‰ŒÐr   N)Ú__name__Ú
__module__Ú__qualname__r#   r)   © r   r   r   r   3   s2   € € € € € ð.ð .ð .ðð ð ð ð r   r   c                   ó    — e Zd Zd„ Zd„ Zd„ ZdS )ÚEpisodicLifeEnvc                 ób   — t           j                             | |¦  «         d| _        d| _        dS )zœMake end-of-life == end-of-episode, but only reset on true game over.
        Done by DeepMind for the DQN and co. since it helps value estimation.
        r   TN)r   r   r#   ÚlivesÚwas_real_terminatedr$   s     r   r#   zEpisodicLifeEnv.__init__?   s1   € õ 	Œ×Ò˜T 3Ñ'Ô'Ð'ØˆŒ
Ø#'ˆÔ Ð Ð r   c                 óØ   — | j                              |¦  «        \  }}}}}|| _        | j         j        j                             ¦   «         }|| j        k     r|dk    rd}|| _        |||||fS )Nr   T)r
   Ústepr2   Ú	unwrappedÚaler1   )r%   ÚactionÚobsr)   Ú
terminatedÚ	truncatedÚinfor1   s           r   r4   zEpisodicLifeEnv.stepG   sw   € Ø37´8·=²=ÀÑ3HÔ3HÑ0ˆˆVZ ¨DØ#-ˆÔ ð ”Ô"Ô&×,Ò,Ñ.Ô.ˆØ4”:ÒÐ %¨!¢) )ð ˆJØˆŒ
ØF˜J¨	°4Ð7Ð7r   c                 óÔ   — | j         r | j        j        di |¤Ž\  }}n | j                             d¦  «        \  }}}}}| j        j        j                             ¦   «         | _        ||fS )zÈReset only when lives are exhausted.
        This way all states are still reachable even though lives are episodic,
        and the learner need not know about any of this behind-the-scenes.
        r   r-   )r2   r
   Úresetr4   r5   r6   r1   )r%   Úkwargsr8   r;   Ú_s        r   r=   zEpisodicLifeEnv.resetU   ss   € ð
 Ô#ð 	2Ø&˜œœÐ0Ð0¨Ð0Ð0‰IˆCð "&¤§¢¨qÑ!1Ô!1ÑˆCAq˜$Ø”XÔ'Ô+×1Ò1Ñ3Ô3ˆŒ
ØDˆyÐr   N©r*   r+   r,   r#   r4   r=   r-   r   r   r/   r/   =   sA   € € € € € ð(ð (ð (ð8ð 8ð 8ðð ð ð ð r   r/   c                   ó    — e Zd Zd„ Zd„ Zd„ ZdS )ÚFireResetEnvc                 óè   — t           j                             | |¦  «         |j                             ¦   «         d         dk    sJ ‚t          |j                             ¦   «         ¦  «        dk    sJ ‚dS )zLTake action on reset.

        For environments that are fixed until firing.é   ÚFIREé   N)r   r   r#   r5   Úget_action_meaningsr   r$   s     r   r#   zFireResetEnv.__init__e   sm   € õ 	Œ×Ò˜T 3Ñ'Ô'Ð'ØŒ}×0Ò0Ñ2Ô2°1Ô5¸Ò?Ð?Ð?Ð?Ý3”=×4Ò4Ñ6Ô6Ñ7Ô7¸1Ò<Ð<Ð<Ð<Ð<Ð<r   c                 ó  —  | j         j        di |¤Ž | j                              d¦  «        \  }}}}}|s|r | j         j        di |¤Ž | j                              d¦  «        \  }}}}}|s|r | j         j        di |¤Ž ||fS )NrD   r   r-   )r
   r=   r4   )r%   r>   r8   r?   r9   r:   r;   s          r   r=   zFireResetEnv.resetm   s´   € ØˆŒŒÐ Ð ˜Ð Ð Ð Ø+/¬8¯=ª=¸Ñ+;Ô+;Ñ(ˆˆQ
˜I qØð 	%˜ð 	%ØˆDŒHŒNÐ$Ð$˜VÐ$Ð$Ð$Ø.2¬h¯mªm¸AÑ.>Ô.>Ñ+ˆˆQ
˜I tØð 	%˜ð 	%ØˆDŒHŒNÐ$Ð$˜VÐ$Ð$Ð$ØDˆyÐr   c                 ó6   — | j                              |¦  «        S r!   ©r
   r4   ©r%   Úacs     r   r4   zFireResetEnv.stepw   ó   € ØŒx}Š}˜RÑ Ô Ð r   N©r*   r+   r,   r#   r=   r4   r-   r   r   rB   rB   c   sA   € € € € € ð=ð =ð =ðð ð ð!ð !ð !ð !ð !r   rB   c                   ó.   — e Zd Zd„ Zdddœd„Zd„ Zd„ ZdS )Ú
FrameStackc                 ó’  — t           j                             | |¦  «         || _        t	          g |¬¦  «        | _        |j        j        }t          j	        t          j        |j        j        |d¬¦  «        t          j        |j        j        |d¬¦  «        |d         |d         |d         |z  f|j        j        ¬¦  «        | _        dS )	zStack k last frames.)Úmaxlenéÿÿÿÿ)ÚrepeatsÚaxisr   rD   r   ©ÚlowÚhighr   ÚdtypeN)r   r   r#   Úkr   Úframesr   r   r   ÚBoxr'   ÚrepeatrW   rX   rY   )r%   r
   rZ   Úshps       r   r#   zFrameStack.__init__}   s¶   € åŒ×Ò˜T 3Ñ'Ô'Ð'ØˆŒÝ˜B qÐ)Ñ)Ô)ˆŒØÔ#Ô)ˆÝ!'¤Ý”	˜#Ô/Ô3¸QÀRÐHÑHÔHÝ”˜3Ô0Ô5¸qÀrÐJÑJÔJØq”6˜3˜qœ6 3 q¤6¨A¡:Ð.ØÔ'Ô-ð	"
ñ "
ô "
ˆÔÐÐr   N©ÚseedÚoptionsc                óÎ   — | j                              ||¬¦  «        \  }}t          | j        ¦  «        D ]}| j                             |¦  «         Œ|                      ¦   «         |fS )Nr_   )r
   r=   ÚrangerZ   r[   ÚappendÚ_get_ob)r%   r`   ra   ÚobÚinfosr?   s         r   r=   zFrameStack.resetŠ   s`   € Ø”H—N’N¨°gNÑ>Ô>‰	ˆˆEÝt”v‘”ð 	#ð 	#ˆAØŒK×Ò˜rÑ"Ô"Ð"Ð"Ø|Š|‰~Œ~˜uÐ$Ð$r   c                 ó¨   — | j                              |¦  «        \  }}}}}| j                             |¦  «         |                      ¦   «         ||||fS r!   )r
   r4   r[   rd   re   )r%   r7   rf   r)   r9   r:   r;   s          r   r4   zFrameStack.step   sO   € Ø26´(·-²-ÀÑ2GÔ2GÑ/ˆˆFJ 	¨4ØŒ×Ò˜2ÑÔÐØ|Š|‰~Œ~˜v z°9¸dÐBÐBr   c                 óv   — t          | j        ¦  «        | j        k    sJ ‚t          j        | j        d¬¦  «        S )Nr   ©rU   )r   r[   rZ   r'   Úconcatenate©r%   s    r   re   zFrameStack._get_ob•   s6   € Ý4”;ÑÔ 4¤6Ò)Ð)Ð)Ð)ÝŒ~˜dœk°Ð2Ñ2Ô2Ð2r   )r*   r+   r,   r#   r=   r4   re   r-   r   r   rP   rP   {   sd   € € € € € ð
ð 
ð 
ð !¨$ð %ð %ð %ð %ð %ðCð Cð Cð
3ð 3ð 3ð 3ð 3r   rP   c                   ó   — e Zd Zd„ Zd„ ZdS )ÚFrameStackTrajectoryViewc                 óä   — t           j                             | |¦  «         |j        j        }|d         dk    sJ ‚t          j        dd|d         |d         f|j        j        ¬¦  «        | _        dS )z4No stacking. Trajectory View API takes care of this.r   rD   r   éÿ   rV   N)r   r   r#   r   r   r   r\   rY   )r%   r
   r^   s      r   r#   z!FrameStackTrajectoryView.__init__œ   sq   € åŒ×Ò˜T 3Ñ'Ô'Ð'ØÔ#Ô)ˆØ1Œv˜Š{ˆ{ˆ{ˆ{Ý!'¤Ø˜ C¨¤F¨C°¬FÐ#3¸3Ô;PÔ;Vð"
ñ "
ô "
ˆÔÐÐr   c                 ó.   — t          j        |d¬¦  «        S )NrS   rj   )r'   Úsqueeze©r%   Úobservations     r   rt   z$FrameStackTrajectoryView.observation¥   s   € ÝŒz˜+¨BÐ/Ñ/Ô/Ð/r   N)r*   r+   r,   r#   rt   r-   r   r   rn   rn   š   s2   € € € € € ð
ð 
ð 
ð0ð 0ð 0ð 0ð 0r   rn   c                   ó"   — e Zd Zdd„Zd„ Zd„ ZdS )ÚMaxAndSkipEnvé   c                 ó¸   — t           j                             | |¦  «         t          j        d|j        j        z   |j        j        ¬¦  «        | _        || _	        dS )z!Return only every `skip`-th frame)r   )rY   N)
r   r   r#   r'   Úzerosr   r   rY   Ú_obs_bufferÚ_skip)r%   r
   Úskips      r   r#   zMaxAndSkipEnv.__init__«   sV   € åŒ×Ò˜T 3Ñ'Ô'Ð'åœ8Ø3Ô(Ô.Ñ.°cÔ6KÔ6Qð
ñ 
ô 
ˆÔð ˆŒ
ˆ
ˆ
r   c                 ó:  — d}dx}x}}t          | j        ¦  «        D ]]}| j                             |¦  «        \  }}}}}|| j        dz
  k    r
|| j        d<   || j        dz
  k    r
|| j        d<   ||z  }|s|r nŒ^| j                             d¬¦  «        }	|	||||fS )z:Repeat action, sum reward, and max over last observations.g        Nr   r   rD   rj   )rc   r{   r
   r4   rz   Úmax)
r%   r7   Útotal_rewardr9   r:   r;   Úir8   r)   Ú	max_frames
             r   r4   zMaxAndSkipEnv.step´   sØ   € àˆØ(,Ð,ˆ
Ð,Y Ýt”zÑ"Ô"ð 	ð 	ˆAØ7;´x·}²}ÀVÑ7LÔ7LÑ4ˆC˜ Y°ØD”J ‘NÒ"Ð"Ø&)Ô  Ñ#ØD”J ‘NÒ"Ð"Ø&)Ô  Ñ#Ø˜FÑ"ˆLØð ˜Yð Øðð Ô$×(Ò(¨aÐ(Ñ0Ô0ˆ	à˜,¨
°I¸tÐCÐCr   c                 ó&   —  | j         j        di |¤ŽS )Nr-   )r
   r=   )r%   r>   s     r   r=   zMaxAndSkipEnv.resetÇ   s   € ØˆtŒxŒ~Ð'Ð' Ð'Ð'Ð'r   N)rw   r@   r-   r   r   rv   rv   ©   sI   € € € € € ðð ð ð ðDð Dð Dð&(ð (ð (ð (ð (r   rv   c                   ó:   — e Zd Zd	d„Zd„ Zd„ Zd„ Zd„ Zd„ Zd„ Z	dS )
Ú
MonitorEnvNc                 ó¨   — t           j                             | |¦  «         d| _        d| _        d| _        g | _        g | _        d| _        d| _	        dS )z4Record episodes stats prior to EpisodicLifeEnv, etc.Nr   )
r   r   r#   Ú_current_rewardÚ
_num_stepsÚ_total_stepsÚ_episode_rewardsÚ_episode_lengthsÚ_num_episodesÚ_num_returnedr$   s     r   r#   zMonitorEnv.__init__Í   sW   € åŒ×Ò˜T 3Ñ'Ô'Ð'Ø#ˆÔØˆŒØ ˆÔØ "ˆÔØ "ˆÔØˆÔØˆÔÐÐr   c                 ó:  —  | j         j        di |¤Ž\  }}| j        €t          | j        ¦  «        | _        | j        N| j                             | j        ¦  «         | j                             | j        ¦  «         | xj	        dz  c_	        d| _        d| _        ||fS )NrD   r   r-   )
r
   r=   rˆ   ÚsumrŠ   r†   r‰   rd   r‡   r‹   )r%   r>   r8   r;   s       r   r=   zMonitorEnv.resetØ   s¤   € Ø"D”H”NÐ,Ð, VÐ,Ð,‰	ˆˆTàÔÐ$Ý # DÔ$9Ñ :Ô :ˆDÔàÔÐ+ØÔ!×(Ò(¨Ô)=Ñ>Ô>Ð>ØÔ!×(Ò(¨¬Ñ9Ô9Ð9ØÐÔ !Ñ#ÐÔà ˆÔØˆŒàDˆyÐr   c                 ó°   — | j                              |¦  «        \  }}}}}| xj        |z  c_        | xj        dz  c_        | xj        dz  c_        |||||fS )NrD   )r
   r4   r†   r‡   rˆ   )r%   r7   r8   Úrewr9   r:   r;   s          r   r4   zMonitorEnv.stepè   si   € Ø04´·²¸fÑ0EÔ0EÑ-ˆˆS*˜i¨ØÐÔ Ñ#ÐÔØˆŒ˜1ÑˆŒØÐÔ˜QÑÐÔØC˜ Y°Ð4Ð4r   c                 ó   — | j         S r!   )r‰   rl   s    r   Úget_episode_rewardszMonitorEnv.get_episode_rewardsï   ó   € ØÔ$Ð$r   c                 ó   — | j         S r!   )rŠ   rl   s    r   Úget_episode_lengthszMonitorEnv.get_episode_lengthsò   r“   r   c                 ó   — | j         S r!   )rˆ   rl   s    r   Úget_total_stepszMonitorEnv.get_total_stepsõ   s   € ØÔ Ð r   c              #   óÈ   K  — t          | j        t          | j        ¦  «        ¦  «        D ]}| j        |         | j        |         fV — Œt          | j        ¦  «        | _        d S r!   )rc   rŒ   r   r‰   rŠ   )r%   r€   s     r   Únext_episode_resultszMonitorEnv.next_episode_resultsø   sl   è è € ÝtÔ)­3¨tÔ/DÑ+EÔ+EÑFÔFð 	Gð 	GˆAØÔ(¨Ô+¨TÔ-BÀ1Ô-EÐFÐFÐFÐFÐFÝ  Ô!6Ñ7Ô7ˆÔÐÐr   r!   )
r*   r+   r,   r#   r=   r4   r’   r•   r—   r™   r-   r   r   r„   r„   Ë   s‚   € € € € € ð	ð 	ð 	ð 	ðð ð ð 5ð 5ð 5ð%ð %ð %ð%ð %ð %ð!ð !ð !ð8ð 8ð 8ð 8ð 8r   r„   c                   ó"   — e Zd Zdd„Zd„ Zd„ ZdS )ÚNoopResetEnvé   c                 óº   — t           j                             | |¦  «         || _        d| _        d| _        |j                             ¦   «         d         dk    sJ ‚dS )zsSample initial states by taking random number of no-ops on reset.
        No-op is assumed to be action 0.
        Nr   ÚNOOP)r   r   r#   Únoop_maxÚoverride_num_noopsÚnoop_actionr5   rG   )r%   r
   rŸ   s      r   r#   zNoopResetEnv.__init__   s]   € õ 	Œ×Ò˜T 3Ñ'Ô'Ð'Ø ˆŒØ"&ˆÔØˆÔØŒ}×0Ò0Ñ2Ô2°1Ô5¸Ò?Ð?Ð?Ð?Ð?Ð?r   c                 óÄ  —  | j         j        di |¤Ž | j        | j        }nb	 | j        j                             d| j        dz   ¦  «        }n8# t          $ r+ | j        j                             d| j        dz   ¦  «        }Y nw xY w|dk    sJ ‚d}t          |¦  «        D ]@}| j          
                    | j        ¦  «        \  }}}}}|s|r | j         j        di |¤Ž\  }}ŒA||fS )z7Do no-op action for a number of steps in [1, noop_max].NrD   r   r-   )r
   r=   r    r5   Ú	np_randomÚintegersrŸ   ÚAttributeErrorÚrandintrc   r4   r¡   )r%   r>   Únoopsr8   r?   r9   r:   r;   s           r   r=   zNoopResetEnv.reset
  s  € àˆŒŒÐ Ð ˜Ð Ð Ð ØÔ"Ð.ØÔ+ˆEˆEðOØœÔ0×9Ò9¸!¸T¼]ÈQÑ=NÑOÔOøå!ð Oð Oð OØœÔ0×8Ò8¸¸D¼MÈAÑ<MÑNÔNðOøøøàqŠyˆyˆyˆyØˆÝu‘”ð 	5ð 	5ˆAØ26´(·-²-ÀÔ@PÑ2QÔ2QÑ/ˆCJ 	¨4Øð 5˜Yð 5Ø*˜DœHœNÐ4Ð4¨VÐ4Ð4‘	TøØDˆyÐs   £(A Á2BÂ Bc                 ó6   — | j                              |¦  «        S r!   rJ   rK   s     r   r4   zNoopResetEnv.step  rM   r   N)rœ   rN   r-   r   r   r›   r›   þ   sJ   € € € € € ð@ð @ð @ð @ðð ð ð*!ð !ð !ð !ð !r   r›   c                   ó$   ‡ — e Zd Zˆ fd„Zd„ Zˆ xZS )ÚNormalizedImageEnvc                 ó²   •—  t          ¦   «         j        |i |¤Ž t          j                             dd| j        j        t          j        ¬¦  «        | _        d S )Ng      ð¿ç      ð?)r   rY   )	Úsuperr#   r   r   r\   r   r   r'   Úfloat32)r%   Úargsr>   Ú	__class__s      €r   r#   zNormalizedImageEnv.__init__%  sV   ø€ Ø‰ŒÔ˜$Ð) &Ð)Ð)Ð)Ý!$¤§¢ØØØÔ(Ô.Ý”*ð	 "0ñ "
ô "
ˆÔÐÐr   c                 óL   — |                      t          j        ¦  «        dz  dz
  S )Ng      `@r¬   )Úastyper'   r®   rs   s     r   rt   zNormalizedImageEnv.observation0  s"   € Ø×"Ò"¥2¤:Ñ.Ô.°Ñ6¸#Ñ=Ð=r   )r*   r+   r,   r#   rt   Ú__classcell__)r°   s   @r   rª   rª   #  sG   ø€ € € € € ð
ð 
ð 
ð 
ð 
ð>ð >ð >ð >ð >ð >ð >r   rª   c                   ó"   — e Zd Zddefd„Zd„ ZdS )ÚGrayScaleAndResizeTÚ	grayscalec                 óà   — t           j                             | |¦  «         || _        || _        || _        t          j        dd| j        | j        |rdndft          j	        ¬¦  «        | _
        dS )z.Warp frames to the specified size (dim x dim).r   rp   rD   rF   rV   N)r   ÚObservationWrapperr#   ÚwidthÚheightr¶   r   r\   r'   Úuint8r   )r%   r
   Údimr¶   s       r   r#   zGrayScaleAndResize.__init__6  sq   € åÔ×'Ò'¨¨cÑ2Ô2Ð2ØˆŒ
ØˆŒØ"ˆŒÝ!'¤ØØØ”; ¤
°Ð,A¨A¨AÀÐBÝ”(ð	"
ñ "
ô "
ˆÔÐÐr   c                 ó¼   — | j         r:t          |¦  «        }t          || j        | j        ¬¦  «        }|d d …d d …d f         S t          || j        | j        ¬¦  «        S )N)rº   r¹   )r¶   r	   r   rº   r¹   )r%   Úframes     r   rt   zGrayScaleAndResize.observationC  sb   € ØŒ>ð 	GÝ˜U‘O”OˆEÝ˜5¨¬¸D¼JÐGÑGÔGˆEØ˜˜˜˜A˜A˜A˜t˜Ô$Ð$å˜%¨¬¸4¼:ÐFÑFÔFÐFr   N)T)r*   r+   r,   Úboolr#   rt   r-   r   r   rµ   rµ   4  sH   € € € € € ð
ð 
¨Dð 
ð 
ð 
ð 
ðGð Gð Gð Gð Gr   rµ   é@   rw   Tr¼   Ú	frameskipÚ
framestackr¶   c                 ó„  — t           j                             | d¬¦  «        } t          | ||¬¦  «        } t	          | ¦  «        } |dk    r| j        €J ‚t          | |¬¦  «        } t          | d¬¦  «        } t          | ¦  «        } d	| j	         
                    ¦   «         v rt          | ¦  «        } |rt          | |¬
¦  «        } | S )ae  Wraps `env` for new-API-stack-friendly RLlib Atari experiments.

    Note that we assume reward clipping is done outside the wrapper.

    Args:
        env: The env object to wrap.
        dim: Dimension to resize observations to (dim x dim).
        frameskip: Whether to skip n frames and max over them (keep brightest pixels).
        framestack: Whether to stack the last n (grayscaled) frames. Note that this
            step happens after(!) a possible frameskip step, meaning that if
            frameskip=4 and framestack=2, we would perform the following over this
            trajectory:
            actual env timesteps: 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 -> ...
            frameskip:            ( max ) ( max ) ( max   ) ( max     )
            framestack:           ( stack       ) (stack              )

    Returns:
        The wrapped gym.Env.
    ià¥ )Úmax_episode_steps)r¼   r¶   rD   N©r|   rœ   ©rŸ   rE   )rZ   )r   ÚwrappersÚ	TimeLimitÚ	WarpFramerª   Úspecrv   r›   r/   r5   rG   rB   rP   )r
   r¼   rÁ   rÂ   r¶   s        r   Úwrap_atari_for_new_api_stackrË   O  sÎ   € õ< Œ,×
 Ò
  ¸Ð
 Ñ
?Ô
?€Cå
C˜S¨IÐ
6Ñ
6Ô
6€Cå
˜SÑ
!Ô
!€Cà1‚}€}ØŒxÐ#Ð#Ð#Ý˜C iÐ0Ñ0Ô0ˆõ s RÐ
(Ñ
(Ô
(€Cå
˜#Ñ
Ô
€Cà”×2Ò2Ñ4Ô4Ð4Ð4Ý˜3ÑÔˆàð ,Ý˜ 
Ð+Ñ+Ô+ˆØ€Jr   éT   Fc                 ó8  — t          | ¦  «        } t          | d¬¦  «        } | j        |du rt          | d¬¦  «        } t	          | ¦  «        } d| j                             ¦   «         v rt          | ¦  «        } t          | |¦  «        } |du rt          | d¦  «        } | S )a   Configure environment for DeepMind-style Atari.

    Note that we assume reward clipping is done outside the wrapper.

    Args:
        env: The env object to wrap.
        dim: Dimension to resize observations to (dim x dim).
        framestack: Whether to framestack observations.
    rœ   rÆ   NTrw   rÅ   rE   )
r„   r›   rÊ   rv   r/   r5   rG   rB   rÉ   rP   )r
   r¼   rÂ   Únoframeskips       r   Úwrap_deepmindrÏ   …  s¨   € õ S‰/Œ/€CÝ
s RÐ
(Ñ
(Ô
(€CØ
„xÐ ¨tÐ 3Ð 3Ý˜C aÐ(Ñ(Ô(ˆÝ
˜#Ñ
Ô
€CØ”×2Ò2Ñ4Ô4Ð4Ð4Ý˜3ÑÔˆÝ
C˜Ñ
Ô
€Cð TÐÐÝ˜˜aÑ Ô ˆØ€Jr   )rÀ   rw   NT)rÌ   TF)%Úcollectionsr   Útypingr   r   Ú	gymnasiumr   Únumpyr'   r   Úray.rllib.utils.annotationsr   Úray.rllib.utils.imagesr   r	   ÚEnvr   r¿   r   r   r"   r   r   r/   rB   rP   r¸   rn   rv   r„   r›   rª   rµ   rÉ   ÚintrË   rÏ   r-   r   r   ú<module>rØ      sÂ  ðØ Ð Ð Ð Ð Ð Ø "Ð "Ð "Ð "Ð "Ð "Ð "Ð "à Ð Ð Ð Ø Ð Ð Ð Ø Ð Ð Ð Ð Ð à 1Ð 1Ð 1Ð 1Ð 1Ð 1Ø 3Ð 3Ð 3Ð 3Ð 3Ð 3Ð 3Ð 3ð ðC%˜œ ˜Ô%ð C¨$ð Cð Cð Cñ „ðCð2 ð	ð 	ñ „ð	ð ðð ð ð ð CÔ%ñ ô ñ „ðð ð"ð "ð "ð "ð "c”kñ "ô "ñ „ð"ðJ ð!ð !ð !ð !ð !3”;ñ !ô !ñ „ð!ð. ð3ð 3ð 3ð 3ð 3”ñ 3ô 3ñ „ð3ð< ð0ð 0ð 0ð 0ð 0˜sÔ5ñ 0ô 0ñ „ð0ð ð(ð (ð (ð (ð (C”Kñ (ô (ñ „ð(ðB ð/8ð /8ð /8ð /8ð /8”ñ /8ô /8ñ „ð/8ðd ð!!ð !!ð !!ð !!ð !!3”;ñ !!ô !!ñ „ð!!ðH ð>ð >ð >ð >ð >˜Ô/ñ >ô >ñ „ð>ð  ðGð Gð Gð Gð G˜Ô/ñ Gô Gñ „ðGð. €	ð ð ØØ $Øð2ð 2Ø	Œð2à	ð2ð ð2ð ˜”ð	2ð
 ð2ð 	„Wð2ð 2ð 2ñ „ð2ðj ðð ð ñ „ðð ð r   